Trong phân tích dữ liệu, việc tạo biểu đồ động giúp trình bày thông tin một cách trực quan và sinh động. Matplotlib là một trong những thư viện mạnh mẽ nhất trong Python giúp bạn thực hiện điều này. UniTrain sẽ hướng dẫn chi tiết cách tạo biểu đồ động với Matplotlib.

Install & Import

Để sử dụng thư viện Matplotlib, bước đầu tiên sau khi thiết lập môi trường Python là chúng ta phải cài đặt package phải không nào. Sử dụng pip install matplotlib để cài đặt version mới nhất.

Sau đó ta import thư viện bằng dòng code : 

import matplotlib.pyplot as plt

Dưới đây là những hướng dẫn cơ bản để vẽ biểu đồ với Matplotlib.

  1. Tạo biểu đồ đơn giản

Sau đây ta vẽ một biểu đồ đơn giản với phương thức plot(), mặc định nó sẽ vẽ biểu đồ đường. Với các tham số tối thiểu là list các tọa độ x, list tọa độ y (lưu ý 2 list này phải có độ dài bằng nhau).

Ví dụ minh họa như sau:

Picture1

Để thay đổi một chút, ta có thể thêm tham số về định dạng vào 

Chẳng hạn như :

– Tham số màu :  r – red, g –green, b – blue, y – yellow, …
– Định dạng đường :  – (đường thẳng), — (đường nét đứt), nếu không truyền tham số là không vẽ đường.
– Định dạng đỉnh :  * (đỉnh hình bông tuyết), D (đỉnh hình thoi), s (đỉnh hình vuông), go (chấm tròn), …

Ví dụ : Ở ví dụ này mình thêm tham số b tức là màu blue, D tức là đỉnh hình thoi và — tức là cạnh nét đứt.

Picture2

  1. Vẽ nhiều đối tượng trong cùng một biểu đồ

Ta sẽ thêm title cho biểu đồ, title cho trục tọa độ và thêm chú thích, ví dụ như sau:

Picture3

Đoạn code trong hình ta thấy : 

– Tham số label trong hàm plt.plot() là để đặt tên cho một điểm, tên này sẽ xuất hiện trong chú thích.
 plt.xlabel hay plt.ylabel là để đặt tên cho trục x và trục y.
– plt.title là để đặt tên cho biểu đồ
– plt.legend sẽ đi tìm các thành phần chứa tham số label và đưa vào chú thích 
  1. Thay đổi kích thước của biểu đồ 

Ta sử dụng phương thức figure() để thay đổi kích thước của biểu đồ, tham số truyền vào là figsize.

Ví dụ được mô tả như dưới đây:

Picture4

Ở ví dụ trên tham số truyền vào là figsize=(10,7) trong đó 10 là tỉ lệ độ dài trục ngang (x) và 7 là tỉ lệ độ dài trục dọc (y). Ta cũng thấy có plt.xlim và plt.ylim. Hai phương thức này dùng để xác định hệ số chia trên trục tương ứng.

  1. Vẽ hai biểu đồ cạnh nhau 

Picture5

Đầu tiên ta sử dụng phương thức subplots() để tạo ra 2 biểu đồ. Sử dụng subplots() các đối tượng Axes sẽ được trả về. Sau đó bạn có thể set các thuộc tính của từng đối tượng này sử dụng ax1.set hay ax2.set như trên (mỗi đối tượng axes định nghĩa cho một biểu đồ)

Tham số (1,2) trong hàm subplots có thể hiểu là “một hàng, hai cột” – tương ứng bạn sẽ vẽ ra 2 biểu đồ cạnh nhau. Nếu chẳng hạn bạn thay (1,2) bằng (2,2), bạn sẽ được 4 biểu đồ. 

Tham số dpi là độ phân giải của hình vẽ.

Tham số sharey = True cho phép chia sẻ thuộc tính giữa 2 trục x và y.

  1. Vẽ trên nhiều biểu đồ sử dụng vòng lặp 

Picture6

Đây là một kỹ thuật khá hữu ích, nhất là khi bạn muốn vẽ biểu đồ từ một cơ sở dữ liệu hay file dữ liệu được.

Đầu tiên bạn tạo một subplot với số biểu đồ mà bạn muốn vẽ lên, sau đó các đối tượng Axes được tạo ra và bạn sẽ sử dụng các đối tượng này trong vòng lặp for để đưa dữ liệu vào các biểu đồ tương ứng. 

Kết luận

Matplotlib là một tính năng mạnh mẽ để tạo biểu đồ động trong Python. Bằng cách nắm vững các kỹ thuật cơ bản và nâng cao, bạn có thể tạo ra các biểu đồ trực quan, sinh động và hiệu quả cho các dự án phân tích dữ liệu của mình.

Xem thêm 

Combo Khóa học Business Intelligence

Khóa học Xử lý và trực quan hóa dữ liệu với Python

Khóa học Ứng dụng SQL trong xử lý dữ liệu

Tags