Làm sạch dữ liệu với Microsoft Excel

Trước khi dữ liệu được sử dụng cho việc phân tích hay báo cáo, chúng cần được “làm sạch” để không ảnh hưởng đến chất lượng của kết quả. Đây là một bước vô cùng quan trọng trong mọi quy trình phân tích dữ liệu.  

Trong bài viết này, hãy cùng UniTrain làm sạch dữ liệu với những thao tác vô cùng đơn giản trên Microsoft Excel nhé! 

1. Loại bỏ dữ liệu bị trùng 

Exc1

Kéo chọn cả bảng > Conditional Formatting (tab Home) > Highlight Cells Rules > Duplicate Values > Hộp thoại New Formatting Rules hiện lên > Chọn OK. Những ô dữ liệu bị trùng sẽ được đỏ. 

Exc2

Để xóa đi dữ liệu bị trùng ở cột Employee_Name, click chọn Remove Duplicates (tab Data) > tick vào ô Employee_Name > OK 

Kết quả:  

Exc3

Để xóa định dạng tô đỏ ta kéo chọn cả bảng > Conditional Formatting (tab Home) > Clear Rules > Clear Rules from Selected Cells.

2. Tách dữ liệu

Giả sử chúng ta cần tách họ sang cột B, cột A chỉ để lại tên 

Exc4

Ta kéo chọn cả bảng > Text to Columns (tab Data) > Next > Tick vào ô Comma (để phân tách dựa trên dấu phẩy) > Next > Finish 

Kết quả:  

Exc5

3. Xóa khoảng trắng trong ô dữ liệu 

Exc6

Để xóa khoảng trắng trong tên nhân viêncột A, chúng ta click chọn ô B2 sử dụng hàm trim 


Exc7

Kết quả  Exc8

Xem thêm: 

Phân tích dữ liệu bằng PivotTable

Cập nhật tính năng mới trong Excel – Tháng 02/2024

Khóa học Combo Excel for Professionals

[Free download] Excel for Accountants

Để lại một bình luận

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *

1 + 1 = ? (Nhập Haii để trả lời đúng)

Bài viết liên quan
Phím tắt Excel giúp tiết kiệm 90% thời gian nhập liệu

Trong quá trình xử lý dữ liệu bằng Excel, việc sử dụng các phím tắt không chỉ giúp tối ưu tốc độ làm việc mà còn tăng tính chính xác. Bài

Xem thêm
Ứng dụng hàm TEXTJOIN nâng cao trong Excel

1. Giới thiệu hàm TEXTJOIN và IF  Hàm TEXTJOIN trong Excel giúp nối các giá trị từ một phạm vi hoặc danh sách các ô, sử dụng dấu phân cách tùy

Xem thêm
30 tháng Tư rực rỡ, 01 tháng Năm ưu đãi bất ngờ

Mừng 50 năm thống nhất Đất nước, UniTrain ưu đãi đến 2.500.000 VNĐ trên học phí gốc cho học viên đăng ký các khóa combo. Hình thức online: 🔸Giảm 1.400.000đ trên học

Xem thêm
Nối các mảng dữ liệu trong Python

Trong quá trình xử lý dữ liệu với pandas, việc kết hợp nhiều bảng dữ liệu là thao tác rất phổ biến. Hàm concat() chính là công cụ mạnh mẽ giúp

Xem thêm