Series Workshop Online - VBA in Excel 06/06/2026

Thực hành thiết lập tự động hóa các thao tác thủ công trong xử lý dữ liệu và lập báo cáo trong Excel

Trực quan hóa dữ liệu với Python

Với nhiều thư viện đồ họa tuyệt vời cùng với nhiều tính năng, Python sẽ giúp bạn trực quan hóa dữ liệu một cách hiệu quả. Một vài thư viện phổ biến như: Matplotlib, Pandas Visualization, Seaborn, ggplot, Plotly… Bài viết này sẽ tập trung tìm hiểu tính năng của Matplotlib và Pandas Visualization.

Nhập dữ liệu

UniTrain sẽ sử dụng hai bộ dữ liệu có sẵn miễn phí: Bộ dữ liệu Iris và Wine Reviews. Cả hai đều có thể tải bằng phương pháp read_csv pandas.

Trực Quan Hóa Dữ Liệu Với Python 1

Trực Quan Hóa Dữ Liệu Với Python 2

Matplotlib – Python Data Visualization

Matplotlib là thư viện python phổ biến nhất.

Để cài đặt Matplotlib, pip và conda có thể được sử dụng.

Pip install matplotlib
hoặc
conda install matplotlib

Matplotlib đặc biệt tốt để tạo các biểu đồ cơ bản như line charts, bar charts, histograms và nhiều hơn nữa. Nó có thể được nhập bằng cách gõ:

import matplotlib.pyplot as plt

1. Scatter Plot

Chúng ta sử dụng phương thức scatter để tạo một scatter plot trong Matplotlib. Chúng ta cũng sẽ tạo một hình và một trục bằng cách sử dụng plt.subplots để  cung cấp cho biểu đồtiêu đề và nhãn.

Trực Quan Hóa Dữ Liệu Với Python 3

Để biểu đồ nhiều ý nghĩa hơn chúng ta có thể tô màu trong mỗi điểm dữ liệu theo lớp của nó. Điều này có thể được thực hiện bằng cách tạo một từ điển ánh xạ từ lớp sang màu và sau đó tự phân tán từng điểm bằng cách sử dụng vòng lặp for và chuyển màu tương ứng.

Trực Quan Hóa Dữ Liệu Với Python 4

2. Line Chart

Chúng ta tạo một line chart bằng phương thức plot. Chúng ta cũng có thể vẽ nhiều cột trong một biểu đồ, bằng cách lặp qua các cột mà chúng ta muốn và vẽ từng cột trên cùng một trục.

Trực Quan Hóa Dữ Liệu Với Python 5

3. Histogram

Chúng ta tạo Histogram bằng phương thức hist. Nếu chúng ta chuyển dữ liệu phân loại như cột điểm từ bộ dữ liệu đánh giá, nó sẽ tự động tính toán tần suất mỗi lớp xảy ra.

Trực Quan Hóa Dữ Liệu Với Python 6

4. Bar chart

Một bar chart có thể được tạo bằng phương thức bar. Bar chart không tự động tính toán tần suất của danh mục nên chúng ta sẽ sử dụng chức năng value_counts pandas để thực hiện việc này.

Trực Quan Hóa Dữ Liệu Với Python 7

Pandas Visualization – Python Data Visualization

Pandas là một thư viện hiệu suất cao, dễ sử dụng, cung cấp các cấu trúc dữ liệu. Pandas Visualization dễ dàng tạo ra các plot từ một khung dữ liệu và chuỗi pandas. Nó cũng có API cấp cao hơn Matplotlib và do đó chúng ta cần ít code hơn cho cùng kết quả.

Pandas có thể được cài đặt bằng cách sử dụng pip hoặc conda.

pip install pandas
hoặc
conda install pandas

1. Scatter Plot

Để tạo một scatter plot trong Pandas, chúng ta gọi <dataset>.plot.scatter() và truyền cho nó hai đối số, tên của cột x cũng như tên của cột y.

Trực Quan Hóa Dữ Liệu Với Python 8

2. Line Chart

Để tạo một line chart trong Pandas, chúng ta gọi <dataframe>.plot.line(). Trong khi ở Matplotlib, chúng ta cần lặp lại từng cột mà chúng ta muốn vẽ, trong Pandas chúng ta không cần phải làm điều này vì nó tự động vẽ tất cả các cột số có sẵn (ít nhất là nếu chúng tôi không chỉ định một cột cụ thể).

Trực Quan Hóa Dữ Liệu Với Python 9

3. Histogram

Chúng ta tạo một Histogram với phương thức plot.hist. Không có bất kỳ đối số bắt buộc nào nhưng chúng ta có thể tùy ý chuyển một số như kích thước.

Trực Quan Hóa Dữ Liệu Với Python 10

Tạo nhiều histogram cũng rất dẽ dàng

Trực Quan Hóa Dữ Liệu Với Python 11

Đối số subplots chỉ định rằng chúng ta muốn có một plot riêng cho từng tính năng và layout chỉ định số lượng plot trên mỗi hàng và cột.

4. Bar Chart

Để vẽ bar chart, chúng ta sử dụng phương thức plot.bar(). Trước khi chúng ta gọi nó, chúng ta cần lấy dữ liệu của mình. Trước tiên chúng ta sẽ đếm các lần xuất hiện bằng phương thức value_count() và sau đó sắp xếp các lần xuất hiện từ nhỏ nhất đến lớn nhất bằng phương thức sort_index().

Trực Quan Hóa Dữ Liệu Với Python 12

Phương pháp này cũng rất đơn giản để tạo một biểu đồ thanh ngang.

Trực Quan Hóa Dữ Liệu Với Python 13

Chúng ta cũng có thể vẽ các dữ liệu khác vào đây.

Trực Quan Hóa Dữ Liệu Với Python 14

Trong ví dụ trên, chúng ta nhóm dữ liệu theo quốc gia và sau đó lấy giá trị trung bình của giá rượu, và vẽ 5 quốc gia có giá rượu trung bình cao nhất.

Qua bài viết, bạn đã đi qua các hướng dẫn cụ thể để trực quan hóa dữ liệu với Python. Dữ liệu phức tạp sẽ trở nên đơn giản, dễ hiểu nhờ đó mang lại giá trị và giúp đưa ra quyết định nhanh chóng trong kinh doanh. Với sự dễ sử dụng của mình, Python đang trở thành xu hướng của trực quan hóa dữ liệu hiện nay.

UniTrain Tổng hợp

Xem thêm

Khóa học Xử lý và trực quan hóa dữ liệu với Python

Python có thể ứng dụng như thế nào trong cuộc sống?

 

 

Để lại một bình luận

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *

1 + 1 = ? (Nhập Haii để trả lời đúng)

Bài viết liên quan
Data Analysis Breakthrough Scholarship 2026

Với mong muốn tạo điều kiện cho các bạn trẻ tiếp cận kiến thức bài bản và phát triển tư duy phân tích dữ liệu thực tiễn, Data Analysis Breakthrough Scholarship 2026 chính

Xem thêm
Ưu đãi tháng 05/2026

Chương trình ưu đãi 05/2026 này mang đến ưu đãi kép cho học viên: Giảm ngay 155.000đ trên mức ưu đãi đóng sớm khi học viên đăng ký bất kỳ khóa học nào trong tháng này.

Xem thêm
So sánh ChatGPT vs Gemini vs Claude 2026: Nên chọn AI tool nào?

Ba cái tên ChatGPT, Gemini và Claude xuất hiện ở khắp nơi khi nói về AI, nhưng không cái nào là “tốt nhất tuyệt đối”. Mỗi tool có điểm mạnh khác

Xem thêm
Claude là gì? Tìm hiểu AI assistant của Anthropic và cách dùng 2026

Nếu bạn đã nghe tên ChatGPT nhưng chưa biết Claude là gì, bạn đang bỏ qua một trong những AI assistant mạnh nhất hiện nay, đặc biệt nếu công việc của

Xem thêm