Data Warehouse là gì?

Là một loại hệ thống được xây dựng nhằm mục đích lưu trữ dữ liệu từ nhiều nguồn khác nhau – trong hoặc ngoài doanh nghiệp (dữ liệu được mua). Data Warehouse hoạt động như một “ngân hàng” lưu trữ dữ liệu trung tâm. Theo đó, dữ liệu đi vào từ các “cổng” khác nhau, theo phương thức tự động (hệ thống giao dịch, phần mềm bán hàng) hoặc chủ động (bộ phận kế toán, nhân sự).

Cấu trúc của Data Warehouse

Tùy thuộc vào nhu cầu của doanh nghiệp, Data Warehouse phân tích thành một số kiến ​​trúc phổ biến:

Units

Các kho dữ liệu đều có một thiết kế cơ bản chung, với siêu dữ liệu, bản tóm tắt dữ liệu và dữ liệu thô được lưu trong kho lưu trữ trung tâm. Kho lưu trữ được cung cấp bởi các nguồn dữ liệu ở đầu, được người dùng cuối truy cập để thực hiện phân tích, báo cáo và khai thác ở đầu còn lại.

Hub và Spoke

Việc bổ sung các kho dữ liệu giữa kho lưu trữ trung tâm và người dùng cuối cho phép doanh nghiệp tùy chỉnh kho dữ liệu của họ, nhằm phục vụ cho nhiều lĩnh vực kinh doanh khác nhau. Khi dữ liệu đã sẵn sàng để sử dụng, sẽ được chuyển đến data mart phù hợp.

Sandbox

Sandbox là khu vực riêng tư, bảo mật cho phép doanh nghiệp khám phá bộ dữ liệu mới hoặc cách phân tích dữ liệu mà không cần phải tuân thủ theo các quy tắc và giao thức chính thức của Kho dữ liệu.

Lợi ích của Data Warehouse

– Cải thiện quyền truy cập của người dùng cuối vào nhiều loại dữ liệu doanh nghiệp
– Tăng tính nhất quán của dữ liệu
– Cung cấp một nơi để kết hợp dữ liệu liên quan từ các nguồn riêng biệt
– Tạo cơ sở hạ tầng điện toán để hỗ trợ những thay đổi trong hệ thống máy tính và cấu trúc kinh doanh
– Trao quyền cho người dùng cuối thực hiện truy vấn hoặc báo cáo đặc biệt mà không ảnh hưởng đến hiệu suất của hệ thống hoạt động

Ai là người sử dụng Data Warehouse

– Nhân sự cấp lãnh đạo chịu trách nhiệm đưa ra quyết định kinh doanh dựa trên cơ sở dữ liệu

– Nhân sự chuyên phân tích dữ liệu

– Nhân sự có nhu cầu truy cập dữ liệu (đa phòng ban: Marketing, HR, Kế toán,…)

– Nhân sự muốn tổng hợp thông tin để báo cáo

Xem thêm

COMBO EXCEL DÀNH CHO NGƯỜI CHUYÊN NGHIỆP 

Dọn dẹp dữ liệu Excel – 5 kỹ thuật làm sạch dữ liệu trong Excel

Một Nhà phân tích dữ liệu thực sự đang làm gì?