Nói một cách đơn giản, mart dữ liệu là kho dữ liệu bị giới hạn phạm vi và có thể lấy dữ liệu thông qua việc tóm tắt và chọn dữ liệu từ kho dữ liệu hoặc với sự trợ giúp của quá trình trích xuất, chuyển đổi và tải riêng biệt từ hệ thống dữ liệu nguồn.
Biểu đồ so sánh
Cơ sở để so sánh | Kho dữ liệu | Dữ liệu Mart |
---|---|---|
Căn bản | Kho dữ liệu là ứng dụng độc lập. | Data mart là cụ thể để quyết định ứng dụng hệ thống hỗ trợ. |
Loại hệ thống | Tập trung | Phân cấp |
Dạng dữ liệu | Chi tiết | Tóm tắt |
Sử dụng không chuẩn hóa | Các dữ liệu hơi bất thường. | Các dữ liệu rất không chuẩn hóa. |
Mô hình dữ liệu | Từ trên xuống | Từ dưới lên |
Thiên nhiên | Linh hoạt, định hướng dữ liệu và cuộc sống lâu dài. | Hạn chế, định hướng dự án và cuộc sống ngắn. |
Loại lược đồ được sử dụng | Chòm sao thực tế | Ngôi sao và bông tuyết |
Dễ xây dựng | Khó xây dựng | Xây dựng đơn giản |
Định nghĩa kho dữ liệu
Kho dữ liệu có nghĩa là một biến thể theo thời gian, hướng đối tượng, không biến đổi và một nhóm dữ liệu tích hợp hỗ trợ quá trình ra quyết định của quản lý. Ngoài ra, nó là một kho thông tin được thu thập từ nhiều nguồn, được lưu trữ trong một lược đồ thống nhất, tại một trang web duy nhất cho phép tích hợp nhiều hệ thống ứng dụng. Một khi dữ liệu này được thu thập, nó được lưu trữ trong một thời gian dài, do đó có tuổi thọ cao và cho phép truy cập vào thông tin lịch sử .
Do đó, kho dữ liệu cung cấp cho người dùng một giao diện tích hợp duy nhất cho dữ liệu thông qua đó người dùng có thể viết các truy vấn hỗ trợ quyết định một cách dễ dàng. Kho dữ liệu giúp biến dữ liệu thành thông tin. Thiết kế một kho dữ liệu bao gồm cách tiếp cận từ trên xuống.
Nó tập hợp thông tin về các chủ đề trải rộng trong toàn bộ tổ chức, chẳng hạn như khách hàng, doanh số, tài sản, vật phẩm, và do đó phạm vi của nó là toàn doanh nghiệp. Nói chung, lược đồ chòm sao thực tế được sử dụng trong nó, bao gồm nhiều đối tượng khác nhau. Kho dữ liệu không phải là một cấu trúc tĩnh và nó đang phát triển liên tục.
Định nghĩa của Data Mart
Một mart dữ liệu có thể được gọi là một tập hợp con của kho dữ liệu hoặc một nhóm phụ của dữ liệu toàn công ty tương ứng với một nhóm người dùng nhất định. Kho dữ liệu liên quan đến một số dữ liệu logic và bộ phận phải liên tục trong minh họa dữ liệu của họ để đảm bảo tính mạnh mẽ của kho dữ liệu. Data mart là một tập hợp các bảng tập trung vào một nhiệm vụ duy nhất, chúng được thiết kế bằng cách sử dụng phương pháp tiếp cận từ dưới lên.
Vì lược đồ sao và bông tuyết được hướng tới mô hình chủ đề duy nhất, đó là lý do tại sao chúng thường được sử dụng trong mart dữ liệu. Mặc dù, lược đồ sao phổ biến hơn lược đồ bông tuyết. Tùy thuộc vào nguồn dữ liệu, các dữ liệu có thể được phân thành hai loại: các dữ liệu phụ thuộc và dữ liệu độc lập .
Sự khác biệt chính giữa Kho dữ liệu và Data Mart
- Kho dữ liệu là ứng dụng độc lập trong khi data mart dành riêng cho ứng dụng hệ thống hỗ trợ quyết định.
- Dữ liệu được lưu trữ trong một kho lưu trữ tập trung duy nhất trong kho dữ liệu. Đối với, dữ liệu mart lưu trữ dữ liệu trong khu vực người dùng.
- Kho dữ liệu chứa một dạng dữ liệu chi tiết . Ngược lại, mart dữ liệu chứa dữ liệu tóm tắt và được chọn.
- Dữ liệu trong kho dữ liệu hơi không chuẩn hóa trong khi trong trường hợp Data mart thì nó rất không chuẩn hóa.
- Việc xây dựng kho dữ liệu liên quan đến cách tiếp cận từ trên xuống . Ngược lại, trong khi xây dựng một mart dữ liệu , cách tiếp cận từ dưới lên được sử dụng.
- Kho dữ liệu là tính linh hoạt, định hướng thông tin và có tính chất lâu dài. Ngược lại, mart dữ liệu bị hạn chế, định hướng dự án và có thời gian tồn tại ngắn hơn.
- Lược đồ chòm sao thực tế thường được sử dụng để mô hình hóa kho dữ liệu trong khi đó trong lược đồ sao mart dữ liệu phổ biến hơn.
Phần kết luận
Kho dữ liệu cung cấp chế độ xem doanh nghiệp, hệ thống lưu trữ đơn và tập trung, kiến trúc vốn có và tính độc lập ứng dụng trong khi Data mart là tập hợp con của kho dữ liệu cung cấp chế độ xem bộ phận, lưu trữ phi tập trung. Vì kho dữ liệu rất lớn và tích hợp, nó có nguy cơ thất bại và khó khăn cao trong việc xây dựng nó. Mặt khác, mart dữ liệu rất dễ xây dựng và rủi ro thất bại liên quan cũng ít hơn nhưng mart dữ liệu có thể gặp phải sự phân mảnh.