Merge dữ liệu trong Power Query

Khi cần kết hợp dữ liệu từ các bảng liên quan với nhau, thay vì nhập thủ công hay dùng công thức như Vlookup, chúng ta có thể sử dụng tính năng Merge Queries trong Power Query.

Power Query là một công cụ do Microsolf phát triển từ năm 2010, giúp ta dễ dàng kết nối, chuyển đổi và tự động hóa xử lý những dữ liệu dữ liệu lớn.

Giả sử: Công ty A theo dõi dữ liệu doanh số bán hàng theo mã khách hàng (customer_id), dữ liệu từ hệ thống xuất ra 2 file : file “Alpha_Transactions” thể hiện giao dịch bán hàng và file “File Customer_Lookup” thể hiện thông tin khách hàng. Trong trường hợp này, chúng ta cần kết hợp dữ liệu doanh số bán hàng với cột khóa là “customer_id”

Các bước thực hiện:

Bước 1. Vào Tab Home > Merge Queries > Merge Queries as New.

Merge Power Query

Bước 2. Chọn hai bảng dữ liệu cần Merge:

Merge Power Query

 

Sau đó, chọn cột khóa (primary key và foreign key) ở hai bảng dữ liệu:

Merge Power Query

  • Primary key (khóa chính): là cột có dữ liệu duy nhất cho mỗi dòng, không trùng lặp và không null. Bảng chứa Primary key có vai trò là bảng chính (Dim table).

Ví dụ: “customer_id” trong bảng Customer_Lookup là primary key vì mỗi khách hàng có mã duy nhất, không trùng, không null.

  • Foreign key (khóa ngoại): là cột có trong bảng Transaction Table, tham chiếu đến Primary key trong Dim

Ví dụ: “customer_id” trong bảng Alpha_Transaction tham chiếu đến “customer_id” trong bảng chính (Customer_Lookup)

Bước 3. Chọn kiểu Merge dữ liệu:
Trong trường hợp này, chúng ta sẽ chọn Join Kind phổ biến là Left Outer (giữ tất cả dữ liệu từ bảng bên trái, chỉ lấy các dữ liệu phù hợp từ bảng bên phải)

Merge Power Query

Bước 4. Expand hoặc Aggregate cột dữ liệu vừa được Merge:
Click vào mũi tên bên phải tên cột > Chọn Expand/Aggregate > OK.

Bước 5. Đổi tên Query vừa tạo.

Bước 6. Close và Load để load bảng dữ liệu kết quả ra Excel.

Xem thêm:

Khóa học Tổ chức và quản lý dữ liệu báo cáo trong Excel

Khóa học Advanced Power Query

Sử dụng Power Query trong Excel để chuẩn hóa dữ liệu

Bài viết liên quan
Ứng dụng hàm TEXTJOIN nâng cao trong Excel

1. Giới thiệu hàm TEXTJOIN và IF  Hàm TEXTJOIN trong Excel giúp nối các giá trị từ một phạm vi hoặc danh sách các ô, sử dụng dấu phân cách tùy

Xem thêm
30 tháng Tư rực rỡ, 1/5 ưu đãi bất ngờ

Mừng 50 năm thống nhất Đất nước, UniTrain ưu đãi đến 2.500.000 VNĐ trên học phí gốc cho học viên đăng ký các khóa combo. CÁC COMBO KHÓA HỌC ÁP DỤNG

Xem thêm
Nối các mảng dữ liệu trong Python

Trong quá trình xử lý dữ liệu với pandas, việc kết hợp nhiều bảng dữ liệu là thao tác rất phổ biến. Hàm concat() chính là công cụ mạnh mẽ giúp

Xem thêm
Phân biệt WHERE và HAVING trong SQL

Trong SQL, lọc dữ liệu là một bước quan trọng giúp truy vấn trả về kết quả chính xác và tối ưu hơn. Hai mệnh đề thường được sử dụng để

Xem thêm