Một chiến lược phân tích dữ liệu kém có thể làm mất tiền của một công ty. Do đó, người làm phân tích nên kiểm tra xem kết quả phân tích có chính xác hay không. Trong bài viết này, bạn sẽ học cách khớp các kết quả phân tích bằng Python, SQL và Tableau.
Tạo lược đồ SQL
Đầu tiên, chúng ta chuẩn bị lược đồ cơ sở dữ liệu bao gồm 9 bảng (như hình bên dưới). Bảng này cho thấy sự kết nối giữa chín bảng. Nó dựa trên một hệ thống quản lý cơ sở dữ liệu quan hệ (RDBMS).
Kết nối với Python
Bước 1: Tạo tệp Python dưới dạng sổ ghi chép Jupyter
Trong bước này, chúng ta tạo một tập tin python có dạng là Jupyter Notebook (.ipynb) và lưu tệp ở bất cứ đâu trên ổ đĩa cục bộ của mình.
Bước 2: Nhập Pyodbc / Pandas vào tệp Python
Bước tiếp theo là nhập các mô-đun pyodbc và pandas trong tệp Python và kết nối cơ sở dữ liệu mở (ODBC) là một trình điều khiển cơ sở dữ liệu và Pyodbc mang Python và ODBC lại với nhau. Pandas là một công cụ thao tác mạnh mẽ được xây dựng dựa trên ngôn ngữ lập trình Python. Bạn có thể tìm hiểu thêm chi tiết về python từ liên kết.
Bước 3: Điều chỉnh chuỗi kết nối
Bây giờ, chúng ta điều chỉnh các chuỗi kết nối. Đối với ví dụ này, trình điều khiển của ta phải là phiên bản SQL Server mà chúng ta sử dụng; đây là SQL Server 2017. Ngoài ra còn có các phiên bản SQL Server 2016/2014/2012. Bây giờ, chúng ta kết nối với SQL Server dưới dạng “localhost” bằng Xác thực Windows. Cơ sở dữ liệu chính của chúng ta mà chúng ta kết nối là “SampleSales”. Do đó, chúng ta điều chỉnh kết nối của mình thông qua Trình điều khiển ODBC được hiển thị bên dưới:
Bước 4: Thực thi truy vấn SQL bằng cách tạo con trỏ từ kết nối
Trong bước này, chúng ta thực hiện truy vấn SQL bằng cách tạo một con trỏ, như trong ví dụ dưới đây. Ta chỉ đưa ra một ví dụ về một truy vấn bên dưới. Nó có thể thay đổi theo phân tích của chúng ta. Chúng ta có thể thấy code trông như thế này:
Bước 5: Thu hồi kết quả yêu cầu từ trỏ chuột
Trong giai đoạn này, chúng ta sử dụng phương thức cursor.fetchall() để lấy kết quả truy vấn bằng cách sử dụng for loop từ con trỏ:
Bước 6: Đóng trỏ chuột / kết nối
Trong giai đoạn cuối này, ta nên đóng cả con trỏ và kết nối để tránh để lại cơ sở dữ liệu mở. Để làm điều này, ta sẽ viết các lệnh dưới đây:
Bước 7: Mã đầy đủ của ví dụ
Dưới đây, chúng ta có thể tìm thấy code đầy đủ của ví dụ này.
Kết nối với Cơ sở dữ liệu từ Tableau
Đầu tiên, sau khi mở Tableau, chúng ta nên kết nối với Microsoft SQL Server. Chúng ta sẽ nhấp vào nút “Thêm” và chọn Microsoft SQL Server.
Sau đó, chúng ta thấy trang bên dưới. Chúng ta nên điền vào chỗ trống về tên máy chủ, tên cơ sở dữ liệu và khu vực xác thực của trang này.
Đối với tên máy chủ, chúng ta nên viết tên máy tính. Lưu ý tên cơ sở dữ liệu mà chúng ta muốn kết nối trong Microsoft SQL Server Management Studio cho tên cơ sở dữ liệu.
Trong khu vực xác thực, có hai lựa chọn; một trong số đó là “Sử dụng Xác thực Windows (nên dùng)” và cái còn lại là “Sử dụng tên người dùng và mật khẩu cụ thể.”
Chọn cái nào phù hợp với cá nhân. Nếu chọn “Sử dụng Xác thực Windows (ưu tiên)“, ta có thể kết nối tự động. Nếu chọn “Sử dụng tên người dùng và mật khẩu cụ thể“, ta nên viết tên người dùng và mật khẩu của mình cho khu vực.
Cuối cùng, chúng ta nên nhấp vào nút “Đăng nhập”.
Sau đó, chúng ta thấy một bảng được hiển thị bên dưới. Có các bảng của cơ sở dữ liệu “SampleSales” trong bảng.
Các bảng này giống như bảng cơ sở dữ liệu “SampleSales” của Microsoft SQL Server Management Studio bên dưới.
Sau đó, ta sẽ tham gia các bảng với nhau. Chúng ta sử dụng phương pháp “mối quan hệ” cho mục tiêu này. Điều quan trọng là phải nối các bảng như lược đồ cơ sở dữ liệu được hiển thị trong hình 1.
Xem thêm