Có thể bạn đã từng nghe đến thuật ngữ khoa học dữ liệu trước đây. Nhưng đối với nhiều người, đây vẫn là một khái niệm xa vời. Khoa học dữ liệu thực sự có sức lan tỏa lớn hơn bạn có thể tưởng tượng. Chúng ta có thể thấy ứng dụng của nó ở khắp mọi nơi trong cuộc sống hàng ngày. Dưới đây là một số ví dụ thực tế về sự ảnh hưởng của khoa học dữ liệu trong cuộc sống ngày nay.

1. Hệ thống đề xuất phim của Netflix

Bạn đã bao giờ tự hỏi vì sao Netflix có thể dự đoán chính xác những gì bạn thích và không chưa? Tất cả là nhờ vào hệ thống khoa học dữ liệu.

Từng đề xuất phim của Netflix đều được cá nhân hóa thông qua hoạt động của bạn. Đó có thể là lịch sử xem phim, thể loại và diễn viên bạn thường xem cũng như xếp hạng các tựa phim của bạn. Sau đó, Netflix đề xuất cho bạn những chương trình và bộ phim bạn chưa xem nhưng được những người dùng tương tự như bạn yêu thích.

Để tiến thêm một bước nữa, Netflix cũng sử dụng Aesthetic Visual Analysis hay còn gọi là AVA. AVA phân tích lịch sử xem phim của bạn để đưa ra các đề xuất với thumbnail hấp dẫn mà bạn có thể sẽ nhấp vào. Ví dụ: nếu bạn đã xem nhiều bộ phim truyền hình lãng mạn, Netflix sẽ đặt ảnh thumbnail cho tất cả các đề xuất có cảnh lãng mạn hoặc cặp đôi, ngay cả khi đó chỉ là một phần nhỏ của bộ phim.

2. Danh sách phát hàng tuần của Spotify’s Discover

Thứ Hai hàng tuần, Spotify tạo danh sách phát Discover Weekly được cá nhân hóa cho từng người dùng. Đó là một danh sách gồm 30 bài hát mà người dùng chưa từng nghe mà bạn có thể sẽ thích. Nhưng làm thế nào Spotify biết đủ về người dùng của mình để đưa ra khuyến nghị này? Câu trả lời là trong khoa học dữ liệu.

Danh sách phát Discover Weekly Spotify được tạo tạo thông qua 3 mô hình dữ liệu khác nhau: Filtering, Natural Language Processing (NLP) và Audio File Analysis (phân tích tệp âm thanh). Filtering về cơ bản, mô hình này xem xét các hoạt động của bạn và những người có cùng sở thích giống bạn. Sau đó, hệ thông sẽ chọn bài hát mà những người khác có sở thích tương tự và gợi ý cho bạn.

Spotify cũng thu thập dữ liệu thông qua từ khóa mọi người mô tả một số bản nhạc – đây chính là hoạt động của Natural Language Processing. Bài hát có vẻ buồn bã, hay thăng hoa? Hya một bài hát mang giai điệu mùa hè? Sau đó, hệ thống sẽ tiến hành ghi lại các từ phổ biến và sử dụng thông tin đó để phân loại bài hát thành từng nhóm. Bằng cách sử dụng dữ liệu này, người dùng dễ dàng tìm thấy các bản nhạc thông qua mô tả phần mô tả và đề xuất.

Audio File Analysis hơi khác so với hai mô hình trên. Hệ thống này không dựa vào những thông tin mô tả từ người sử dụng. Thay vào đó, nó phân tích thành phần của tệp âm thanh như nhịp độ, độ lớn, phím và thời gian. Sau đó, Audio File Analysis kết nối các tệp này với những người nghe nhạc có cùng sở thích. Điều này đặc biệt hữu ích cho việc khám phá các bài hát mới và ít người biết.

3. Đối tượng quảng cáo của Facebook

Mặc dù chủ yếu được biết đến là công ty truyền thông xã hội, nhưng nguồn thu chính của Facebook là quảng cáo. Facebook “bán không gian”, trao độ phủ sóng cho các công ty và thương hiệu để quảng cáo sản phẩm và dịch vụ của họ. Nhưng làm thế nào nền tảng mạng xã họi này có thể biết đối tượng mục tiêu để quảng cáo hiệu quả?

Là một công ty truyền thông xã hội, Facebook có quyền truy cập vào rất nhiều dữ liệu và sử dụng dữ liệu này để phân loại người dùng thành các nhóm cụ thể thông qua các trang bạn thích, tin tức bạn tương tác. Sau đó, họ đưa bạn vào các nhóm cụ thể dựa trên tất cả thông tin này, chẳng hạn như “người hâm mộ Star Wars”, “hội yêu mèo” hoặc “mẹ bỉm sữa”.

Sau đó, các bên cần quảng cáo có thể sử dụng thông tin này để gửi quảng cáo của mình đến các đối tượng có liên quan.

Nếu có một ngành phát triển mạnh mẽ nhờ sự ra đời của khoa học dữ liệu, thì đó phải là ngành tiếp thị và quảng cáo. Không gì thể hiện tính hiệu quả của khoa học dữ liệu trong quảng cáo hơn đối tượng quảng cáo của Facebook.

4. Thuật toán của Grab để đối sánh tài xế với hành khách

Kể từ thời điểm bạn đăng nhập vào ứng dụng, bạn đã và đang cung cấp dữ liệu cho Grab thông qua vị trí, lịch sử đi lại và hình thức thanh toán của bạn. Để phân tích được dữ liệu này, công ty thuê các chuyên gia dữ liệu về 5 lĩnh vực: máy học, thị trường, tối ưu hóa, mô phỏng và kiến ​​trúc.

Grab ghi lại hoạt động của từng người dùng và lưu trữ dưới dạng dữ liệu. Sau đó, các chuyên gia sẽ sử dụng dữ liệu này để cải thiện và tối ưu hóa các dịch vụ của Grab.

Grab chính là ứng dụng hàng đầu trong trong lĩnh vực công nghệ này kể từ khi Uber ngừng hoạt động. Để đảm bảo rằng công ty luôn bắt kịp các xu hướng và duy trì sự cạnh tranh, Grab tiếp tục sử dụng khoa học dữ liệu để khám phá các mô hình mới và thông tin chi tiết về cơ sở người tiêu dùng của họ.

UniTrain lược dịch

Xem thêm

Khoa học dữ liệu là gì? Hướng dẫn cơ bản cho người mới làm quen với khoa học dữ liệu

11 kỹ năng phân tích dữ liệu cần thiết vào năm 2021