Bạn một chuyên viên phân tích dữ liệu dữ liệu, một sinh viên mong muốn nâng cao kỹ năng phân tích, hay đơn giản chỉ một người đam khám phá thế giới thông qua dữ liệu? Để thực hành nâng cao kỹ năng của mình, việc tìm kiếm những bộ dữ liệu chất lượng, đa dạng điều cùng quan trọng. Bài viết này sẽ giới thiệu đến bạn Top 6 website cung cấp những b d liệu miễn phí, phù hợp với hầu hết c ch đ phân tích d liệu, giúp bạn thỏa sức khám phá và sáng tạo. 

1. Google Dataset Search (Truy cập tại đây)

– Loại dữ liệu: Đa dạng

– Dữ liệu được biên soạn bởi: Google

– Truy cập: Miễn phí và trả phí

– Bộ dữ liệu mẫu: Giá cà phê toàn cầu từ năm 1990 đến nay

Có vẻ như chúng ta tìm đến Google cho mọi thứ ngày nay, và dữ liệu cũng không ngoại lệ. Ra mắt vào năm 2018, Google Dataset Search giống như một công cụ tìm kiếm tiêu chuẩn của Google, nhưng chỉ dành riêng cho dữ liệu.

2. Kaggle (Truy cập tại đây)

– Loại dữ liệu: Đa dạng

– Dữ liệu được biên soạn bởi: Kaggle

– Truy cập: Miễn phí, nhưng cần đăng ký

– Bộ dữ liệu mẫu: Nhiệt độ hàng ngày của các thành phố lớn

Kaggle ra mắt vào năm 2010 với một số cuộc thi về học máy. Kể từ đó, nó đã phát triển thành một nền tảng dữ liệu mở nổi tiếng, cung cấp sự hợp tác dựa trên đám mây cho các nhà khoa học dữ liệu, cũng như các công cụ giáo dục để giảng dạy trí tuệ nhân tạo và các kỹ thuật phân tích dữ liệu… và tất nhiên, rất nhiều bộ dữ liệu tuyệt vời bao gồm hầu hết mọi chủ đề bạn có thể tưởng tượng.

3. Data.Gov (Truy cập tại đây)

– Loại dữ liệu: Chính phủ

– Dữ liệu được tổng hợp bởi: Chính phủ Liên bang Hoa Kỳ

– Truy cập: Miễn phí, không cần đăng ký

– Bộ dữ liệu mẫu: Báo cáo Chuyển tải và Hoạt động buôn bán Tôm Hùm

Vào năm 2015, Chính phủ Hoa Kỳ đã công khai tất cả dữ liệu của mình. Với hơn 200.000 bộ dữ liệu bao gồm mọi thứ từ biến đổi khí hậu đến tội phạm, bạn có thể dành hàng giờ để khám phá cơ sở dữ liệu này.

4. UCI Machine Learning Repository (Truy cập tại đây)

– Loại dữ liệu: Máy học

– Dữ liệu được tổng hợp bởi: Đại học California Irvine

– Truy cập: Miễn phí, không cần đăng ký

– Bộ dữ liệu mẫu: Giao thông đô thị ở Sao Paulo, Brazil

Được ra mắt cách đây ba mươi năm bởi Đại học California Irvine, kho dữ liệu UCI có uy tín mạnh mẽ trong giới sinh viên, giáo viên và nhà nghiên cứu như là một nơi đáng tin cậy để tìm kiếm dữ liệu về máy học.

5. Earth Data (Truy cập tại đây)

– Loại dữ liệu: Khoa học Trái Đất

– Dữ liệu được biên soạn bởi: NASA

– Truy cập: Miễn phí, không cần đăng ký

– Bộ dữ liệu mẫu: Điều kiện môi trường trong mùa săn nai sừng tấm mùa thu ở Alaska, 2000-2016

Được công khai từ năm 1994, kho dữ liệu này cung cấp quyền truy cập vào tất cả dữ liệu quan sát vệ tinh của NASA về hành tinh xanh nhỏ bé của chúng ta.

6. World Bank Open Data (Truy cập tại đây)

– Loại dữ liệu: Dữ liệu kinh tế, xã hội của các quốc gia trên thế giới.

– Dữ liệu được tổng hợp bởi: Ngân hàng Thế giới.

– Truy cập: Miễn phí

– Bộ dữ liệu mẫu: Tốc độ tăng trưởng GDP của các quốc gia

Đây là một nguồn dữ liệu đáng tin cậy để so sánh và phân tích tình hình kinh tế – xã hội của các quốc gia.

Xem thêm: 

Khóa học Ứng dụng Excel trong Xử lý dữ liệu

Khóa học Excel for HR Professionals

Sử dụng Slicer để lọc dữ liệu trong PivotTable

Thực hành giải Case Study cùng SQL – Data Mart