Làm sạch dữ liệu với Microsoft Excel

Trước khi dữ liệu được sử dụng cho việc phân tích hay báo cáo, chúng cần được “làm sạch” để không ảnh hưởng đến chất lượng của kết quả. Đây là một bước vô cùng quan trọng trong mọi quy trình phân tích dữ liệu.  

Trong bài viết này, hãy cùng UniTrain làm sạch dữ liệu với những thao tác vô cùng đơn giản trên Microsoft Excel nhé! 

1. Loại bỏ dữ liệu bị trùng 

Exc1

Kéo chọn cả bảng > Conditional Formatting (tab Home) > Highlight Cells Rules > Duplicate Values > Hộp thoại New Formatting Rules hiện lên > Chọn OK. Những ô dữ liệu bị trùng sẽ được đỏ. 

Exc2

Để xóa đi dữ liệu bị trùng ở cột Employee_Name, click chọn Remove Duplicates (tab Data) > tick vào ô Employee_Name > OK 

Kết quả:  

Exc3

Để xóa định dạng tô đỏ ta kéo chọn cả bảng > Conditional Formatting (tab Home) > Clear Rules > Clear Rules from Selected Cells.

2. Tách dữ liệu

Giả sử chúng ta cần tách họ sang cột B, cột A chỉ để lại tên 

Exc4

Ta kéo chọn cả bảng > Text to Columns (tab Data) > Next > Tick vào ô Comma (để phân tách dựa trên dấu phẩy) > Next > Finish 

Kết quả:  

Exc5

3. Xóa khoảng trắng trong ô dữ liệu 

Exc6

Để xóa khoảng trắng trong tên nhân viêncột A, chúng ta click chọn ô B2 sử dụng hàm trim 


Exc7

Kết quả  Exc8

Xem thêm: 

Phân tích dữ liệu bằng PivotTable

Cập nhật tính năng mới trong Excel – Tháng 02/2024

Khóa học Combo Excel for Professionals

[Free download] Excel for Accountants

Để lại một bình luận

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *

1 + 1 = ? (Nhập Haii để trả lời đúng)

Bài viết liên quan
Focus Cell trong Excel – Tính năng giúp tăng khả năng điều hướng

Đã bao giờ bạn lạc trôi giữa hàng trăm dòng, hàng ngàn cột trên Excel… mà không biết mình đang ở đâu? Nếu “mất phương hướng” là cảm giác quen thuộc

Xem thêm
Trí tuệ nhân tạo AI là gì? Khái niệm, phân loại và vai trò trong cuộc sống

Trong thời đại cách mạng công nghiệp 4.0, trí tuệ nhân tạo AI đang trở thành một phần không thể thiếu trong nhiều lĩnh vực của cuộc sống. Từ các trợ

Xem thêm
Truy vấn lồng (Subquery) trong SQL – Bí kíp giúp xử lý và truy xuất dữ liệu với mức độ phức tạp cao

Truy vấn lồng (Subquery) là một trong những công cụ hiệu quả trong SQL, giúp xử lý và truy xuất dữ liệu với mức độ phức tạp cao hơn so với

Xem thêm
Hàm TRIMRANGE() – Hàm xóa giá trị trống “đỉnh” hơn cả TRIM.

Như bạn đã biết hàm TRIM() trong Excel giúp loại bỏ các ký tự trống (khoảng trắng). Tương tự vậy hàm TRIMRANGE() được sử dụng để xóa các giá trị trống khỏi một phạm vi

Xem thêm