Merge dữ liệu trong Power Query

Khi cần kết hợp dữ liệu từ các bảng liên quan với nhau, thay vì nhập thủ công hay dùng công thức như Vlookup, chúng ta có thể sử dụng tính năng Merge Queries trong Power Query.

Power Query là một công cụ do Microsolf phát triển từ năm 2010, giúp ta dễ dàng kết nối, chuyển đổi và tự động hóa xử lý những dữ liệu dữ liệu lớn.

Giả sử: Công ty A theo dõi dữ liệu doanh số bán hàng theo mã khách hàng (customer_id), dữ liệu từ hệ thống xuất ra 2 file : file “Alpha_Transactions” thể hiện giao dịch bán hàng và file “File Customer_Lookup” thể hiện thông tin khách hàng. Trong trường hợp này, chúng ta cần kết hợp dữ liệu doanh số bán hàng với cột khóa là “customer_id”

Các bước thực hiện:

Bước 1. Vào Tab Home > Merge Queries > Merge Queries as New.

Merge Power Query

Bước 2. Chọn hai bảng dữ liệu cần Merge:

Merge Power Query

 

Sau đó, chọn cột khóa (primary key và foreign key) ở hai bảng dữ liệu:

Merge Power Query

  • Primary key (khóa chính): là cột có dữ liệu duy nhất cho mỗi dòng, không trùng lặp và không null. Bảng chứa Primary key có vai trò là bảng chính (Dim table).

Ví dụ: “customer_id” trong bảng Customer_Lookup là primary key vì mỗi khách hàng có mã duy nhất, không trùng, không null.

  • Foreign key (khóa ngoại): là cột có trong bảng Transaction Table, tham chiếu đến Primary key trong Dim

Ví dụ: “customer_id” trong bảng Alpha_Transaction tham chiếu đến “customer_id” trong bảng chính (Customer_Lookup)

Bước 3. Chọn kiểu Merge dữ liệu:
Trong trường hợp này, chúng ta sẽ chọn Join Kind phổ biến là Left Outer (giữ tất cả dữ liệu từ bảng bên trái, chỉ lấy các dữ liệu phù hợp từ bảng bên phải)

Merge Power Query

Bước 4. Expand hoặc Aggregate cột dữ liệu vừa được Merge:
Click vào mũi tên bên phải tên cột > Chọn Expand/Aggregate > OK.

Bước 5. Đổi tên Query vừa tạo.

Bước 6. Close và Load để load bảng dữ liệu kết quả ra Excel.

Xem thêm:

Khóa học Tổ chức và quản lý dữ liệu báo cáo trong Excel

Khóa học Advanced Power Query

Sử dụng Power Query trong Excel để chuẩn hóa dữ liệu

Bài viết liên quan
Ưu đãi tháng 03/2025

08/03 NÂNG TẦM KỸ NĂNG – RINH QUÀ NGỌT NGÀO Nhân ngày Quốc tế Phụ nữ 08/03, UniTrain gửi tặng quý học viên CẶP VÉ XEM PHIM CGV 🎟️ khi đăng

Xem thêm
Bắt đầu với Pandas: Cách tạo Series và DataFrame một cách dễ dàng

Pandas là một thư viện phổ biến trong Python, chuyên dùng để phân tích và xử lý dữ liệu. Thư viện này cung cấp hai cấu trúc dữ liệu chính: Series

Xem thêm
Cách Dùng Consolidate Trong Excel Để Nhóm Dữ Liệu Tự Động 

Bạn đang làm việc với một bảng dữ liệu lớn và cần tính tổng doanh thu, số lượng hoặc bất kỳ giá trị nào theo nhóm? Consolidate trong Excel là công

Xem thêm
Tổng hợp dữ liệu nhanh cùng hàm GROUPBY trong Office 365

Hàm GROUPBY giúp bạn nhóm dữ liệu theo một hoặc nhiều cột và thực hiện các phép tính tổng hợp như SUM, AVERAGE, COUNT, MIN, MAX,.. Hàm GROUPBY hoạt động tương

Xem thêm