Các hàm Pandas thông dụng dành cho Data Analyst (Phần 2)

Tiếp nối với phần 1, hãy cùng UniTrain tiếp tục tìm hiểu một số hàm Pandas thông dụng trong Python dành cho Data Analyst nhé! 

Các hàm chúng ta sẽ cùng tìm hiểu hôm nay có chức năng:  

– Cung cấp một cái nhìn chi tiết hơn về bộ dữ liệu 
– Thay đổi một số yếu tố trong bảng dữ liệu  

df.isnull() 

Hàm này giúp ta kiểm tra xem dữ liệu có giá trị thiếu hay không. Khi giá trị tại một vị trí bị thiếu, df.isnull() trả về True cho vị trí đó và False cho tất cả các vị trí khác. 

df.isnull() 

Isnull

df.sort_values() 

Hàm này cho phép bạn sắp xếp lại các hàng trong một DataFrame theo giá trị của một cột cụ thể, theo thứ tự tăng dần hoặc giảm dần. 

Giả sử chúng ta cần sắp xếp lương của nhân viên theo thứ tự tăng dần, ta làm như sau: 

df.sort_values(“Salary”) 

Sort

Theo mặc định, hàm này sẽ trả về kết quả theo thứ tự tăng dần, (ascending=True), để sắp xếp các giá trị theo thứ tự giảm dần (ascending=False), chúng ta làm như sau:  

df_sorted_descending = df.sort_values(by=’Salary’, ascending=False) 

df_sorted_descending 

Screenshot 2024 04 01 At 4.21.27 Pm

df.nlargest() 

Hàm này giúp truy xuất một số giá trị lớn nhất từ một cột cụ thể của DataFrame và tất cả các hàng chứa giá trị đó.  

Giả sử chúng ta cần lấy ra thông tin của 10 nhân viên với SpecialProjectsCount lớn nhất, chúng ta làm như sau: 

df.nlargest(10, “SpecialProjectsCount”) 

Nlarge

df.nsmallest() 

Hàm này giúp truy xuất một số giá trị nhỏ nhất từ một cột cụ thể của DataFrame và tất cả các hàng chứa giá trị đó.  

Giả sử chúng ta cần lấy ra thông tin của 10 nhân viên với SpecialProjectsCount nhỏ nhất, chúng ta làm như sau: 

df.nsmallest(10, “SpecialProjectsCount”) 

Nsmall

df.rename() 

Hàm này giúp chúng ta thay đổi tên của một hay nhiều cột. 

Giả sử chúng ta cần đổi tên cột “EmpID” sang “Employee_ID”, chúng ta làm như sau: 

df.rename(columns = {“EmpID”: “Employee_ID”}, 

           inplace=True) 

df 

Rename

df.drop() 

Hàm này giúp chúng ta xóa một hay nhiều hàng, cột hoặc nhãn khỏi DataFrame. 

Giả sử chúng ta cần xóa cột “Absences”, ta làm như sau: 

df.drop(“Absences”, axis=1) 

Screenshot 2024 04 01 At 4.36.38 Pm

Xem thêm: 

Các hàm Pandas thông dụng dành cho Data Analyst (Phần 1)

Trực quan hóa dữ liệu với Python

Các câu lệnh If trong Python

Khóa học Xử lý và Trực quan hóa dữ liệu với Python 

 

Để lại một bình luận

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *

1 + 1 = ? (Nhập Haii để trả lời đúng)

Bài viết liên quan
[HOẠT ĐỘNG CỘNG ĐỒNG] Cuộc thi Financial Student Contest (FSC) mùa 13 – CLB Tài chính – Chứng khoán (SeSC) – Đại học Ngoại Thương CSII TP. HCM (FTU2)

Chiều tối ngày 13/06/2025, Chung kết cuộc thi Financial Student Contest (FSC) mùa 13 do CLB Tài chính – Chứng khoán (SeSC) thuộc Đại học Ngoại Thương CSII TP. HCM (FTU2)

Xem thêm
[HOẠT ĐỘNG CỘNG ĐỒNG] Cuộc thi myInsight – MDS Datathon Challenge 2025 – CLB Toán ứng dụng & Khoa học dữ liệu (MDS) – CSII Đại học Ngoại Thương TP. HCM (FTU2)

Chiều ngày 08/06/2025 vừa qua, cuộc thi myInsight – MDS Datarthon Challenge 2025 đã chính thức tiến đến vòng chung kết dưới sự góp mặt của top 5 đội thi xuất

Xem thêm
Cảm nhận học viên khóa Excel for Analysts

“Mình rất hài lòng về tính ứng dụng thực tế và khả năng nâng cao hiệu quả công việc của khóa học.” Anh Nguyễn Trung Hòa – nhân sự ngành Kế

Xem thêm
Một số hàm sắp xếp (Sort) phổ biến trong Numpy

Sắp xếp (Sort) là một thao tác phổ biến trong phân tích dữ liệu và lập trình. Nó liên quan đến việc sắp xếp các phần tử trong một tập hợp theo

Xem thêm