Cách sử dụng Python trong Power Query Editor

Python – một ngôn ngữ lập trình được sử dụng rộng rãi bởi các nhà thống kê, nhà khoa học dữ liệu và nhà phân tích dữ liệu, trong Power BI Desktop Power Query Editor. Việc tích hợp Python vào Power Query Editor cho phép các nhân sự đa ngành thực hiện xóa dữ liệu bằng Python, đồng thời thực hiện phân tích và định hình dữ liệu nâng cao trong tập dữ liệu, bao gồm hoàn thành dữ liệu bị thiếu, dự đoán và phân cụm, chỉ để nêu tên một số.

Python là một ngôn ngữ mạnh mẽ và có thể được sử dụng trong Power Query Editor để chuẩn bị mô hình dữ liệu của bạn và tạo báo cáo. Để sử dụng được Python trong Power Query Editor, bạn cần thực hiện theo những bước sau:

Cài đặt Python

Đầu tiên, bạn cần cài đặt Python trên máy cục bộ của mình, bạn có thể tải xuống Python miễn phí từ nhiều nơi, bao gồm cả trang tải xuống Python chính thức và Anaconda. Sau khi đã cài đặt xong, chính là lúc tìm hiểu

Cách sử dụng Python trong Power Query Editor

Để chỉ ra cách sử dụng Python trong Power Query Editor , hãy lấy ví dụ này từ tập dữ liệu thị trường chứng khoán, dựa trên tệp .CSV mà bạn có thể tải xuống từ đây và làm theo. Các bước cho ví dụ này như sau:

1. Đầu tiên, tải dữ liệu của bạn vào Power BI Desktop. Trong ví dụ này, tải tệp csv và chọn Lấy dữ liệu> Văn bản / CSV từ dải băng Trang chủ trong Power BI Desktop

Cách sử dụng Python trong Power Query Editor

2. Chọn tệp và chọn Mở và CSV được hiển thị trong hộp thoại tệp CSV

Cách sử dụng Python trong Power Query Editor

3. Sau khi dữ liệu được tải, bạn sẽ thấy nó trong ngăn Fields ở Power BI Desktop

Cách sử dụng Python trong Power Query Editor

4. Mở Power Query Editor bằng cách chọn Transform data từ tab Home

Cách sử dụng Python trong Power Query Editor

5. Ở trong tab Transform, chọn Run Python Script và trình chỉnh sửa Run Python Script sẽ xuất hiện. Lưu ý rằng hàng 15 và 20 bị thiếu dữ liệu, cũng như các hàng khác mà bạn không thể thấy trong hình ảnh dưới. Các bước dưới đây cho thấy cách Python có thể hoàn thành các hàng đó cho bạn

Cách sử dụng Python trong Power Query Editor

6. Đối với ví dụ này, hãy nhập mã lệnh sau:

Cách sử dụng Python trong Power Query Editor

Khi được đưa vào hộp thoại Run Python Script, mã trông giống như sau:

Cách sử dụng Python trong Power Query Editor

7. Sau khi chọn OK, Power Query Editor sẽ hiển thị cảnh báo về quyền riêng tư của dữ liệu

Cách sử dụng Python trong Power Query Editor

8. Để các tập lệnh Python hoạt động bình thường trong dịch vụ Power BI, tất cả các nguồn dữ liệu cần được đặt thành công khai.

Cách sử dụng Python trong Power Query Editor

Lưu ý: Một cột mới trong ngăn Fields được gọi là Giá trị hoàn thành. Có thể sẽ có một vài phần tử dữ liệu bị thiếu, chẳng hạn như trên hàng 15 và 18

Nguồn: Microsoft

Xem thêm

Chức năng mới: Chuyển đổi Percentiles trong Power Query online

Thêm cột có điều kiện trong Power Query

Combo khóa học: DATA ANALYTICS FOR PROFESSIONALS

Để lại một bình luận

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *

1 + 1 = ? (Nhập Haii để trả lời đúng)

Bài viết liên quan
[RECAP] Training 4: How to Write M&A Buy-Sell Recommendations – Cuộc thi Sinh viên với Tài chính mùa 13 (FSC13) – CLB Tài chính – Chứng khoán SeSC – Trường Đại học Ngoại Thương CSII TP. HCM (FTU2)

Chiều ngày 28/04/2025, buổi Training 4 dành cho Top 8 đội thi xuất sắc nhất cuộc thi Sinh viên với Tài chính mùa 13 (FSC13) đã diễn ra trực tiếp tại

Xem thêm
Phân biệt hàm SUM, SUMX và CALCULATE trong Power BI

1. Giới thiệu Trong Power BI, DAX (Data Analysis Expressions) cung cấp nhiều hàm để tổng hợp và phân tích dữ liệu. Ba trong số các hàm quan trọng nhất là

Xem thêm
[RECAP] Buổi Training vòng 2: IFRS 15 – Revenue from contracts with customers – Cuộc thi The Audit Proud 2025 – CLB Kế toán – Kiểm toán FAC – Trường Đại học Ngoại Thương CSII TP. HCM

Chiều tối ngày 24/04/2025, buổi Training Vòng 2 của cuộc thi The Audit Proud 2025 với chủ đề “IFRS 15 – Revenue from Contracts with Customers” đã diễn ra thành công

Xem thêm
Thêm và Xóa phần tử trong Numpy

NumPy là thư viện Python phổ biến dùng để xử lý dữ liệu dạng mảng nhiều chiều và thực hiện tính toán khoa học. Việc thêm hoặc xóa phần tử trong

Xem thêm