Excel – một ứng dụng phân tích dữ liệu đã trở nên phổ biến với bất kì người đi làm nào. Tuy nhiên, các thao tác lặp đi lặp mỗi ngày trong phần mềm này cũng khiến nhân sự cảm thấy nhàm chán. Do đó, người đi làm luôn đối mặt với suy nghĩ liệu có cách nào thực hiện tốt hơn không. Trong bài viết này, UniTrain sẽ giới thiệu công cụ Python giúp nhân sự tự động hóa mọi công việc trong Excel.
Kết hợp nhiều tệp Excel bằng Python
Người dùng có một số sổ làm việc Excel (chẳng hạn như báo cáo bán hàng hàng tháng). Nếu bạn được yêu cầu tính tổng số lần bán hàng trên tất cả các báo cáo này. Chúng ta có thể dễ dàng kết hợp sổ làm việc Excel với Python, bằng cách sử dụng thư viện Pandas.
Người dùng có thể cài đặt Pandas bằng pip hoặc conda:
Để hiểu rõ hơn, hãy tải 3 tệp Excel dưới đây:
- File 1: https://github.com/datagy/mediumdata/raw/master/january.xlsx
- File 2: https://github.com/datagy/mediumdata/raw/master/february.xlsx
- File 3: https://github.com/datagy/mediumdata/raw/master/march.xlsx
Bạn có thể nhận thấy rằng hầu hết dữ liệu chỉ hiện thị đến hàng thứ 4, vì vậy người dùng cần Pandas để nhập các trang tính bắt đầu từ hàng đó. Cụ thể, chúng ta sẽ dùng các hàm như: read_excel và append.
Cách thực hiện:
- Trong Phần 1, người dùng đã nhập Pandas, tạo danh sách với tất cả URLs, và tạo khung dữ liệu trống được gọi là kết hợp.
- Trong Phần 2, người dùng đã lặp qua từng URL trong tệp để đọc từng tệp vào dữ liệu (“df”), bỏ qua ba hàng đầu tiên và nối tệp đó vào khung dữ liệu kết hợp.
- Trong Phần 3, người dùng tạo một tệp Excel mới có tên là merge.xlsx chứa các sổ làm việc Excel đã hợp nhất.
Nhận giá trị từ các sổ làm việc khác nhau
Hãy xem qua một ví dụ khác. Giả sử chỉ cần lấy tổng số tại Toronto từ mỗi báo cáo bán hàng và thu thập trong một danh sách. Tổng số được lưu trữ trong ô F5 trong mỗi sổ làm việc. Hãy tải xuống các tệp có liên kết ở trên và lưu vào máy của bạn.
Đối với ví dụ này, người dùng sẽ sử dụng một thư viện khác có tên openpyxl. Bạn có thể cài đặt nó bằng pip hoặc conda bằng cách sử dụng mã dưới đây:
Cách thực hiện:
Trong Phần 1:
-Tạo một danh sách (“files”) chứa các liên kết đến các tệp. Trong Windows, bạn có thể nhấn Shift + nhấp chuột phải và sử dụng Copy as Path để lấy đường liên kết của nó.
– Bạn có thể chuyển một chuỗi thành một chuỗi thô, bằng cách thêm tiền tố ‘r’.
– Tạo một danh sách trống để lưu trữ các giá trị.
Trong Phần 2:
– Lặp lại các tệp bằng openpyxl.
– Hình thức tải một tệp: .load_workbook ().
– Sử dụng [‘Sheet1’] và [‘F5’] để tham chiếu đến cả tên trang tính và tham chiếu ô trong sổ làm việc và các đối tượng trang tính.
– Sử dụng thuộc tính .value để trích xuất giá trị của ô và nối nó vào danh sách giá trị.
Ứng dụng hàm trong cửa sổ làm việc
Cùng xem qua ví dụ sau. Trong mỗi sổ làm việc Excel sẽ có tổng số trên các hàng, nhưng không phải tổng số bán hàng. Người dùng có thể mở từng sổ làm việc và thêm vào một hàm cụ thể hoặc có thể sử dụng Python để làm điều này.
Bạn vẫn sẽ sử dụng lại openpyxl.
Trong đoạn mã này, bạn điền một danh sách vào các tệp. Trong for-loop, mở từng tệp và gán “Sheet1” cho một trang biến đổi.
Sau đó, gán chuỗi ‘= SUM (F5: F8)’ cho ô F9 và sử dụng thuộc tính .style để gán đơn vị tiền tệ trực tiếp cho ô.
Kết luận
Python là một công cụ tuyệt vời giúp nhân sự làm việc với các tệp Excel một cách dễ dàng. Trong bài viết này, UniTrain đã giới thiệu cách kết hợp các tệp Excel khác nhau, nhận các giá trị cụ thể và ứng dụng các hàm trên các sổ làm việc. Đôi khi bạn bị nhàm chán với việc giải quyết Excel cả ngày, thì hãy ‘tận dụng’ Python để tự động hóa công việc giúp bạn nhé!
UniTrain lược dịch
Xem thêm
Khóa học Xử lý và Trực quan hóa dữ liệu với Python
Khóa Combo 3 Excel Automation – Power Query + Dashboard + VBA