Một chiến lược phân tích dữ liệu kém có thể làm mất tiền của một công ty. Do đó, người làm phân tích nên kiểm tra xem kết quả phân tích có chính xác hay không. Trong bài viết này, bạn sẽ học cách khớp các kết quả phân tích bằng Python, SQL và Tableau.

Analyzing Data Using Python, SQL And Tableau Simultaneously

 

Tạo lược đồ SQL

Đầu tiên, chúng ta chuẩn bị lược đồ cơ sở dữ liệu bao gồm 9 bảng (như hình bên dưới). Bảng này cho thấy sự kết nối giữa chín bảng. Nó dựa trên một hệ thống quản lý cơ sở dữ liệu quan hệ (RDBMS).

 

uu6nJcMsBg o5sZXzEuHWhQQEUgOS kR ucDo6nTlahWAQEo5kSE3FuUZ9ZItu0h0j9j0k2Ll72xupUY49Cab4UJm5bnPJb1YvsG3cLCsuK1

Kết nối với Python

Bước 1: Tạo tệp Python dưới dạng sổ ghi chép Jupyter

Trong bước này, chúng ta tạo một tập tin python có dạng là Jupyter Notebook (.ipynb) và lưu tệp ở bất cứ đâu trên ổ đĩa cục bộ của mình.

Bước 2: Nhập Pyodbc / Pandas vào tệp Python

Bước tiếp theo là nhập các mô-đun pyodbc và pandas trong tệp Python và kết nối cơ sở dữ liệu mở (ODBC) là một trình điều khiển cơ sở dữ liệu và Pyodbc mang Python và ODBC lại với nhau. Pandas là một công cụ thao tác mạnh mẽ được xây dựng dựa trên ngôn ngữ lập trình Python. Bạn có thể tìm hiểu thêm chi tiết về python từ liên kết.

Import Pyodbc/Pandas into Python File

Bước 3: Điều chỉnh chuỗi kết nối

Bây giờ, chúng ta điều chỉnh các chuỗi kết nối. Đối với ví dụ này, trình điều khiển của ta phải là phiên bản SQL Server mà chúng ta sử dụng; đây là SQL Server 2017. Ngoài ra còn có các phiên bản SQL Server 2016/2014/2012. Bây giờ, chúng ta kết nối với SQL Server dưới dạng “localhost” bằng Xác thực Windows. Cơ sở dữ liệu chính của chúng ta mà chúng ta kết nối là “SampleSales”. Do đó, chúng ta điều chỉnh kết nối của mình thông qua Trình điều khiển ODBC được hiển thị bên dưới:

Regulating the Connection String

Bước 4: Thực thi truy vấn SQL bằng cách tạo con trỏ từ kết nối

Trong bước này, chúng ta thực hiện truy vấn SQL bằng cách tạo một con trỏ, như trong ví dụ dưới đây. Ta chỉ đưa ra một ví dụ về một truy vấn bên dưới. Nó có thể thay đổi theo phân tích của chúng ta. Chúng ta có thể thấy code trông như thế này:

Execute SQL Query by Creating Cursor from Connection

Bước 5: Thu hồi kết quả yêu cầu từ trỏ chuột

Trong giai đoạn này, chúng ta sử dụng phương thức cursor.fetchall() để lấy kết quả truy vấn bằng cách sử dụng for loop từ con trỏ:

Step 5: Recall Inquiry Result from Cursor

Bước 6: Đóng trỏ chuột / kết nối

Trong giai đoạn cuối này, ta nên đóng cả con trỏ và kết nối để tránh để lại cơ sở dữ liệu mở. Để làm điều này, ta sẽ viết các lệnh dưới đây:

Step 6: Close Cursor/Connection

Bước 7: Mã đầy đủ của ví dụ

Dưới đây, chúng ta có thể tìm thấy code đầy đủ của ví dụ này.

Step 7: Full Code of The Example

Kết nối với Cơ sở dữ liệu từ Tableau

Đầu tiên, sau khi mở Tableau, chúng ta nên kết nối với Microsoft SQL Server. Chúng ta sẽ nhấp vào nút “Thêm” và chọn Microsoft SQL Server.

Table-2:  Connecting to Microsoft SQL Server

Sau đó, chúng ta thấy trang bên dưới. Chúng ta nên điền vào chỗ trống về tên máy chủ, tên cơ sở dữ liệu và khu vực xác thực của trang này.

Đối với tên máy chủ, chúng ta nên viết tên máy tính. Lưu ý tên cơ sở dữ liệu mà chúng ta muốn kết nối trong Microsoft SQL Server Management Studio cho tên cơ sở dữ liệu.

Trong khu vực xác thực, có hai lựa chọn; một trong số đó là “Sử dụng Xác thực Windows (nên dùng)” và cái còn lại là “Sử dụng tên người dùng và mật khẩu cụ thể.”

Chọn cái nào phù hợp với cá nhân. Nếu chọn “Sử dụng Xác thực Windows (ưu tiên)“, ta có thể kết nối tự động. Nếu chọn “Sử dụng tên người dùng và mật khẩu cụ thể“, ta nên viết tên người dùng và mật khẩu của mình cho khu vực.

Cuối cùng, chúng ta nên nhấp vào nút “Đăng nhập”.

Table-3: Connecting to Microsoft SQL Server Management Studio.

Sau đó, chúng ta thấy một bảng được hiển thị bên dưới. Có các bảng của cơ sở dữ liệu “SampleSales” trong bảng.

Table-4: Tableau’s Data Source Page

Các bảng này giống như bảng cơ sở dữ liệu “SampleSales” của Microsoft SQL Server Management Studio bên dưới.

Table-5: “SampleSales” database tables in Microsoft SQL Server Management Studio

Sau đó, ta sẽ tham gia các bảng với nhau. Chúng ta sử dụng phương pháp “mối quan hệ” cho mục tiêu này. Điều quan trọng là phải nối các bảng như lược đồ cơ sở dữ liệu được hiển thị trong hình 1.

Table-6: Joining The Tables With Each Other

Xem thêm

Kỹ năng Excel cho kế toán hiện tại và tương lai

Tableau & Power BI: Doanh nghiệp nên chọn công cụ nào?