Công nghệ dữ liệu khối
➤ Gửi thông báo lỗi ⚠️ Báo cáo tài liệu vi phạmNội dung chi tiết: Công nghệ dữ liệu khối
Công nghệ dữ liệu khối
TRƯỜNG ĐẠI HỌC BÁC H KHOA HÀ NỘI VIỆN TOÁN ỨNG DỤNG VÀ TIN HỌC...oOo....DẠI HỌCBÁCH KHOATIẺU LUẬN MÔN HẸ HO TRỌ QUYẾT ĐỊNHĐe tài: Công nghệ dữ liệu kh Công nghệ dữ liệu khốihối<77<77••Giáng viên hướng dần: Lè Chi NgọcLỞI MỜ ĐẢUHệ thống kho dừ liệu cung cấp các công cụ xứ lý phân tích trực tuyến (OLAP) đề tương tác phân tích dừ liệu đa chiều ở các mức độ chi tiết khác nhau. Các công cụ OLAP thường sử dụng khối dừ liệu và mô hình dừ liệu đa chiều để cung cấp quyền truy c Công nghệ dữ liệu khốiập linh hoạt vào dừ liệu tóm tắt. Ví dụ: một khối dừ liệu có thề lưu trừ các biện pháp được tinh toán trước (như đếm 0 và tống doanh số 0) cho nhiều kCông nghệ dữ liệu khối
ết hợp kích thước dừ liệu (như mặt hàng, khu vực và khách hàng). Người dùng có thê đặt ra các truy van OLAP trên dừ liệu. Họ củng có thể lương tác kháTRƯỜNG ĐẠI HỌC BÁC H KHOA HÀ NỘI VIỆN TOÁN ỨNG DỤNG VÀ TIN HỌC...oOo....DẠI HỌCBÁCH KHOATIẺU LUẬN MÔN HẸ HO TRỌ QUYẾT ĐỊNHĐe tài: Công nghệ dữ liệu kh Công nghệ dữ liệu khối hoặc cuộn lên (đê xem dừ liệu ở mửc tòng quát hon mức độ như tổng doanh số mồi quốc gia). Mặc dù khái niệm khối dừ liệu ban đầu được dành cho OLAP. nhưng nó cũng hừu ích cho việc khai thác dừ liệu Khai thác dừ liệu đa chiêu Là một cách tiếp cận để khai thác dừ liệu tích hợp phần tích dữ liệu dựa tr Công nghệ dữ liệu khốiên OLAP với các kỳ' thuật khám phá kiến thức. Nó là còn được gọi là khai thác dừ liệu đa chiều thăm dò và khai thác phàn tích trực tuyến (TUỎI). Nó tìCông nghệ dữ liệu khối
m kiếm các mầu thú vị bảng cách khám phá dừ liệu theo nhiều chiều không gian. Điều này cho phép người dùng tự do tập trung linh hoạt vào bất kỳ' tập hTRƯỜNG ĐẠI HỌC BÁC H KHOA HÀ NỘI VIỆN TOÁN ỨNG DỤNG VÀ TIN HỌC...oOo....DẠI HỌCBÁCH KHOATIẺU LUẬN MÔN HẸ HO TRỌ QUYẾT ĐỊNHĐe tài: Công nghệ dữ liệu kh Công nghệ dữ liệu khốiquy tắc dự đoán và ngoại lệ. Chương này tập trung vào còng nghệ khối dừ liệu. Đặc biệt, chủng tôi nghiên cứu các phương pháp cho tính toán khối dừ liệu vã phương pháp đê phân tích dừ liệu da chiều. Tính toán trước một khối dừ liệu (hoặc các phần cùa khối dừ liệu) cho phép truy cập nhanh các dừ liệu Công nghệ dữ liệu khốitóm tắt. VỚI tinh đa chiểu cao của hầu hết các dừ liệu, phân tích đa chiều có thề chạy vào tắc nghèn hiệu suất. Do đó. điểu quan trọng lã nghiên cứu tCông nghệ dữ liệu khối
inh toán khối dừ liệu kỳ' thuật. May mán thay, công nghệ khối dừ liệu cung cấp nhiều phương pháp hiệu quã và có thê mở rộng đê tinh toán khối. Nghiên TRƯỜNG ĐẠI HỌC BÁC H KHOA HÀ NỘI VIỆN TOÁN ỨNG DỤNG VÀ TIN HỌC...oOo....DẠI HỌCBÁCH KHOATIẺU LUẬN MÔN HẸ HO TRỌ QUYẾT ĐỊNHĐe tài: Công nghệ dữ liệu kh Công nghệ dữ liệu khốic như khám phá các mầu thường xuyên (Chương 6 và 7).3https://khothuvien.coniEm bất đầu trong Phần 5.1 với các khái niệm sơ bộ cho tính toán khối. Chúng tóm tát khái niệm khối dừ liệu như một mạng các khối lập phương và mò tã các dạng khói cơ bân vật chất hóa. Các chiến lược chung cho tính toán khối Công nghệ dữ liệu khốiđược đưa ra.Mục 5.2 sau đây với một cái nhìn sâu sắc về các phương pháp cu thẻ đê tinh toán khối dừ liệu. Tập hợp mãng nhiều đường phương pháp đươc chCông nghệ dữ liệu khối
i tiết cho tính toán khối đầy đú. Phương pháp tinh toán khối lập phương, bao gồm BƯC. Star-Cubing và việc sừ dung các mành võ hình khối, sê được thào TRƯỜNG ĐẠI HỌC BÁC H KHOA HÀ NỘI VIỆN TOÁN ỨNG DỤNG VÀ TIN HỌC...oOo....DẠI HỌCBÁCH KHOATIẺU LUẬN MÔN HẸ HO TRỌ QUYẾT ĐỊNHĐe tài: Công nghệ dữ liệu kh Công nghệ dữ liệu khốiong Phân 5.2. sẻ là các khối lấy mầu đê tra lời truy vấn OLAP trên dừ liệu lấy mầu (vi du: dừ liệu khâo sát. đai diện cho một mầu hoặc tập hợp con của quằn thể dừ liệu mục tiêu quan tâm). Ngoài ra. sè có các cách tính các khối xếp hạng cho truy vấn top-k (xếp hạng) hiệu quá xư lý trong các tập dử li Công nghệ dữ liệu khốiệu quan hệ lớn.Trong Phần 5.4 là mò tã nhiều cách khác nhau đê thực hiện phân tích dử liệu đa chiều sử dụng các khối dử liệu. Các khối dự đoán được giCông nghệ dữ liệu khối
ói thiệu, tạo điều kiện cho mò hình dự đoán trong không gian đa chiều Đánh giá về các khối đa diên, tính toán các truy vấn phức tạp liên quan đến nhiềTRƯỜNG ĐẠI HỌC BÁC H KHOA HÀ NỘI VIỆN TOÁN ỨNG DỤNG VÀ TIN HỌC...oOo....DẠI HỌCBÁCH KHOATIẺU LUẬN MÔN HẸ HO TRỌ QUYẾT ĐỊNHĐe tài: Công nghệ dữ liệu kh Công nghệ dữ liệu khối tuyến dừ liệu đa chiều. "Nhưng bẳng cách nào chúng ta có thê tinh toán các khối dừ liệu trước đê chúng tiện dụng và sần sảng cho xử lý truy vấn? Phần nảy tương phân với vật liệu hóa khối đầy đu (nghĩa lã tiên mả hóa) so với các chiên lược khác nhau cho vật chất hóa khối một phần. Đe hoàn thiên, chủ Công nghệ dữ liệu khốing tôi bắt đầu VỚI việc xem xét các thuật ngừ cơ bân liên quan đến các khối dừ liệu. Chúng tôi cùng giới thiêu một khối ký hiẽu ò rất hừu ích đế mô taCông nghệ dữ liệu khối
các phương pháp lính toán khối dừ liệu.45.1.1 Vật liệu hóa khối: Full Cube, Iceberg Cube, Đóng Cube và Cube Shell.Hình 5.1 cho thấy khối dừ liệu 3 chTRƯỜNG ĐẠI HỌC BÁC H KHOA HÀ NỘI VIỆN TOÁN ỨNG DỤNG VÀ TIN HỌC...oOo....DẠI HỌCBÁCH KHOATIẺU LUẬN MÔN HẸ HO TRỌ QUYẾT ĐỊNHĐe tài: Công nghệ dữ liệu kh Công nghệ dữ liệu khối. Một khối dừ liệu là một mạng các khối. Mồi hình khối đại diện cho một nhóm theo. ABC lã cơ sớ hĩnh khối, chứa câ ba kích thước Ờ đày. số đo tồng hợp. M, được tính cho mồi kết hơp có thê có cua ba chiều Hình khối cơ sớ Là ít khái quát nhất trong tất cá các khối trong khối dừ liệu. Hình khối tông qu Công nghệ dữ liệu khốiát nhất là apex cuboid, thường được đại diện Là lất cả. Nó chửa một giá trị mà nó tòng hợp đo M cho tất cã các bộ lưu trừ trong khối lập phương cơ sở.Công nghệ dữ liệu khối
Đê đi sâu vào khối dừ liệu, chúng tôi di chuyên lừ đinh hình khối trơ xuống trong mạng tinh thề. Đê cuộn lên. chúng tôi di chuyến từ khối lập phương TRƯỜNG ĐẠI HỌC BÁC H KHOA HÀ NỘI VIỆN TOÁN ỨNG DỤNG VÀ TIN HỌC...oOo....DẠI HỌCBÁCH KHOATIẺU LUẬN MÔN HẸ HO TRỌ QUYẾT ĐỊNHĐe tài: Công nghệ dữ liệu kh Công nghệ dữ liệu khốing phai Là một khối riêng lé.46C (baMM'ubokl)Hình 5.1 Mạng cùa các khôi lập phương lạo thành khối dừ liệu 3 chiều với các kích thước A. B và c cho một so biện pháp tổng hợp. M. Một tế bào trong khôi lập phương là một tế bào cơ sở. Một tế bào từ một khối lập phương không phái là một tông hợp tế b«ào. Công nghệ dữ liệu khối Một ô tông hợp tống hợp trên một hoặc nhiều thứ nguyên, trong đó mồi ô tổng hợp kích thước được biêu thị bẳng một trong ký’ hiệu ô. Giã sử chủng la cCông nghệ dữ liệu khối
ỏ một chiều n khôi dừ liệu. Đặt a = (al. a2,.... an. biện pháp) là một ô từ một trong các khối lập phương lên khối dừ liệu. Chúng tòi nói rằng a Là mộTRƯỜNG ĐẠI HỌC BÁC H KHOA HÀ NỘI VIỆN TOÁN ỨNG DỤNG VÀ TIN HỌC...oOo....DẠI HỌCBÁCH KHOATIẺU LUẬN MÔN HẸ HO TRỌ QUYẾT ĐỊNHĐe tài: Công nghệ dữ liệu kh Công nghệ dữ liệu khối m = n. thì a là một tế bào cơ sở. mặt khác, nó là một ô tòng hợp (tức là. trong đó mCông nghệ dữ liệu khối
tổng hợp. Một mối quan hệ hậu duệ tồ tiên có thể tồn tại giừa các tế bào. Trong một chiều n khối dừ liệu, một ô i-D a = (al. a2, .... an. đoa) lã tổ tTRƯỜNG ĐẠI HỌC BÁC H KHOA HÀ NỘI VIỆN TOÁN ỨNG DỤNG VÀ TIN HỌC...oOo....DẠI HỌCBÁCH KHOATIẺU LUẬN MÔN HẸ HO TRỌ QUYẾT ĐỊNHĐe tài: Công nghệ dữ liệu kh Công nghệ dữ liệu khốia được gọi Là cha của ô b và b là con cùa a. nếu và chì kill j = 1 + 1.Ví dụ 5.2 Te bào tổ tiên và hậu duệ. Tham kliào ví dụ 5.1, ô 1-D a = (Jan.,, 2800) và ô 2-D b = (Jan., Business, 150) lã tổ tiên của ò 3-c c = (Jan. Chicago. Kinh doanh. 45); c là hậu duệ của cả a và b; b Là cha mẹ của c; và c là Công nghệ dữ liệu khối một con của b. Đe dám bão OLAP nhanh. đôi khi bạn cần phái tính toán trước toàn bò khối (nghĩa Là tầt câ các ô của tất cá các khối cho một khối dừ liCông nghệ dữ liệu khối
ệu nhất định). Môt phương pháp tính toán khối đầy đu đươc đưa ra trong Mục 5.2.1. Tuy nhiên, tính toán khối đầy đú là theo cấp số nhân của số kích thưTRƯỜNG ĐẠI HỌC BÁC H KHOA HÀ NỘI VIỆN TOÁN ỨNG DỤNG VÀ TIN HỌC...oOo....DẠI HỌCBÁCH KHOATIẺU LUẬN MÔN HẸ HO TRỌ QUYẾT ĐỊNHĐe tài: Công nghệ dữ liệu kh Công nghệ dữ liệu khốiên. 1 Ngoài ra. kích thước cúa mồi hình khối phụ thuộc vào số lượng kích thước của nó. Do đó, tiền mã hóa cùa khối đầy đù có thế đòi hoi số lượng bộ nhớ lớn và thường quá mức. Tuy nhiên, thuật toán tính toán khoi đầy đủ là rất quan trọng. Hình khối cá nhân có thê được lưu trừ trên bộ lưu trừ thứ cầp Công nghệ dữ liệu khối và truy cập khi cần thiết. Ngoài ra. chúng ta có thể sử dụng các thuật toán như vậy để tính các khối nhỏ hơn. bao gồm một tập họp con của tập đà choCông nghệ dữ liệu khối
kích thước hoặc phạm vi nho hơn cùa các giá trị có thê có đổi VỚI một số kích thước. Trong những trường hợp này. khối nhó hơn Là một khối đầy đũ cho tTRƯỜNG ĐẠI HỌC BÁC H KHOA HÀ NỘI VIỆN TOÁN ỨNG DỤNG VÀ TIN HỌC...oOo....DẠI HỌCBÁCH KHOATIẺU LUẬN MÔN HẸ HO TRỌ QUYẾT ĐỊNHĐe tài: Công nghệ dữ liệu kh Công nghệ dữ liệu khối các phương pháp hiệu quã đê tính toán các phần khối.6Gọi ngay
Chat zalo
Facebook