KHO THƯ VIỆN 🔎

Luận án phương pháp đánh chỉ số cho tài liệu xml tin sinh học dựa trên r tree

➤  Gửi thông báo lỗi    ⚠️ Báo cáo tài liệu vi phạm

Loại tài liệu:     PDF
Số trang:         117 Trang
Tài liệu:           ✅  ĐÃ ĐƯỢC PHÊ DUYỆT
 













Nội dung chi tiết: Luận án phương pháp đánh chỉ số cho tài liệu xml tin sinh học dựa trên r tree

Luận án phương pháp đánh chỉ số cho tài liệu xml tin sinh học dựa trên r tree

1Mở ĐÀUTài liệu XML lả dữ liệu văn bân có cấu trúc, hay còn gọi là dữ liệu bán cấu trúc, chúng đà phô biến hãng thập ký nay vì khà nãng Itru trừ dừ li

Luận án phương pháp đánh chỉ số cho tài liệu xml tin sinh học dựa trên r tree iêu rắt linh hoạt và dề dàng chia sê, sư dung qua internet Trước đây, các tài liệu XML thường có kích thước không lớn, nhưng nhùng năm gần đây bắt đầu

xuất hiện các tài liệu XML tin sinh học có kích thước rất lớn có thề lẻn tới Giga, Tera Byte bơi sự phát triền như vũ bào cua công nghệ sinh học tron Luận án phương pháp đánh chỉ số cho tài liệu xml tin sinh học dựa trên r tree

g kỳ nguyên này. Dừ liệu đó có thê tim thấy từ các nguồn dữ liệu uy (in như SRA (công khai các trình tự dược giãi mà), NCBI Genome (các loài đà được g

Luận án phương pháp đánh chỉ số cho tài liệu xml tin sinh học dựa trên r tree

iâi trinh tư), ensembl.org (tồng hop rất nhiều dừ liệu thành BioMart)...Các tài liệu XML (in sinh học là dừ liệu gồm có 2 phần, dữ liệu sinh học (DNA.

1Mở ĐÀUTài liệu XML lả dữ liệu văn bân có cấu trúc, hay còn gọi là dữ liệu bán cấu trúc, chúng đà phô biến hãng thập ký nay vì khà nãng Itru trừ dừ li

Luận án phương pháp đánh chỉ số cho tài liệu xml tin sinh học dựa trên r tree linh hoạt, có thê khác biệt bơi vì chúng được tùy biến theo các cá nhân, tò chức sinh hoc thực hiện.Vì có kích thước lớn như vậy, các tài liệu cơ ban

phai lưu trừ và khai thác trên đĩa cứng, hoặc trong hệ thống lưu trừ phân tán. trước khi có thế truy xuất 1 phần nho đế đưa lên bô nhớ chính (RAM) mồ Luận án phương pháp đánh chỉ số cho tài liệu xml tin sinh học dựa trên r tree

i khi cằn phân tích sâu hơn. Cơ chế truy xuất dĩa cứng là tuần lự và thời gian liêu tốn chậm hơn rất nhiều lằn so vói truy xuất trên RAM. Do vậy. các

Luận án phương pháp đánh chỉ số cho tài liệu xml tin sinh học dựa trên r tree

phương pháp truy vấn cần truy xuất đìa cứng luôn tim cách sao cho lối thiêu số Lần can truy xuất đỉa cứng và lối đa tận dụng bộ nhớ chinh, như lã Cach

1Mở ĐÀUTài liệu XML lả dữ liệu văn bân có cấu trúc, hay còn gọi là dữ liệu bán cấu trúc, chúng đà phô biến hãng thập ký nay vì khà nãng Itru trừ dừ li

Luận án phương pháp đánh chỉ số cho tài liệu xml tin sinh học dựa trên r tree truy vấn. Ví dụ:- Truy vấn Xpath cho 01 tài liêu XML (tìm kiếm chính xác).1.Trích xuất tất ca các dừ liệu có tags có quan hệ cùng nguồn gốc anh em với

nhau cũa 1 loại Chuột Bạch.2.Trích xuất toàn bộ các dừ liệu là hậu duệ cùa heo giống Châu Phi.-Truy vấn tương đồng cho dừ liêu các đoạn DNA (tìm kiếm Luận án phương pháp đánh chỉ số cho tài liệu xml tin sinh học dựa trên r tree

xấp xi)1.Tim kiếm tất cả các Gen tương đồng vói 1 đoạn Gen mầu của một loài mới.Giài pháp truyền thống cho các truy vấn như trên là lưa chọn và cài đ

Luận án phương pháp đánh chỉ số cho tài liệu xml tin sinh học dựa trên r tree

ật các phương pháp đánh chi số (indexing) phù hợp một số loại dừ liệu và truy vắn đặc thù. Các phương pháp này có nhưng gặp nhiều hạn chế với dử liệu

1Mở ĐÀUTài liệu XML lả dữ liệu văn bân có cấu trúc, hay còn gọi là dữ liệu bán cấu trúc, chúng đà phô biến hãng thập ký nay vì khà nãng Itru trừ dừ li

Luận án phương pháp đánh chỉ số cho tài liệu xml tin sinh học dựa trên r tree như vậy gây nên các van đề:1.Lưu trừ dừ liệu chi số này là vấn đề nan giai.2.Nén dử liệu và khai thác dữ liệu đổng thời kém hiệu quả.-Hơn nừa. nếu ch

i số là dừ liệu vãn bán thì vấn đề tốc độ truy vấn van là vẩn đề khó giai quyết.Do vậy, các nghiên cứu gần đây về đánh chi số một tài liệu XML có xu h Luận án phương pháp đánh chỉ số cho tài liệu xml tin sinh học dựa trên r tree

ướng:-Tách tài liệu XML thành 2 phần dừ liệu vã áp dung các phương pháp đánh chi số khác nhau cho phủ hợp với dạng dừ liệu vả loại truy vấn đặc thù. C

Luận án phương pháp đánh chỉ số cho tài liệu xml tin sinh học dựa trên r tree

ụ thề lả:1.Phương pháp đánh chi số dìr liệu cấu trúc (dừ liệu các thé) và hồ trợ các truy van đặc thù như Xpath.2.Phương pháp đánh chi số dừ liệu sinh

1Mở ĐÀUTài liệu XML lả dữ liệu văn bân có cấu trúc, hay còn gọi là dữ liệu bán cấu trúc, chúng đà phô biến hãng thập ký nay vì khà nãng Itru trừ dừ li

Luận án phương pháp đánh chỉ số cho tài liệu xml tin sinh học dựa trên r tree 1.Giâm kích thước dừ liêu gốc ban đầu.2.Áp dụng các phương pháp đánh chi số phủ hợp.33.Cãi thiện tốc độ các truy vần.Các vấn để cần giái quyết rất rộn

g gồm tin học và sinh học, vi vậy nghiên cứu cúa luận án tập trung giãi bài toán Phương pháp đánh chi số hồ trợ cho các truy vấn đặc thù về tốc độ bằn Luận án phương pháp đánh chỉ số cho tài liệu xml tin sinh học dựa trên r tree

g cách giám sổ lần cần truy cập đìa cứng mà vần đạt được kết quả mong đợi.Kết quà luận án đà giãi bài toán Phương pháp đánh chi sổ dừ liệu cấu trúc (d

Luận án phương pháp đánh chỉ số cho tài liệu xml tin sinh học dựa trên r tree

ừ liệu các thẻ) và hồ trợ các truy vấn xpath. Ngoài ra. với bài toán Phương pháp đánh chi sổ dừ liệu Sình học (như các đoạn DNA) và hồ trợ các truy vẩ

1Mở ĐÀUTài liệu XML lả dữ liệu văn bân có cấu trúc, hay còn gọi là dữ liệu bán cấu trúc, chúng đà phô biến hãng thập ký nay vì khà nãng Itru trừ dừ li

Luận án phương pháp đánh chỉ số cho tài liệu xml tin sinh học dựa trên r tree t qua cúa luận án như sau.Mục tiêu thực hiện cùa luận án:-Nghiên cứu phương pháp đánh chi số dựa trẽn phương pháp R-tree nhẩm tăng hiệu quá các truy v

ấn xpath trên dừ liệu XML. thòng qua dừ liệu trung gian được chuyên đôi về dạng tọa độ số cùa các tags. Dừ liệu XML mục tiêu là từ một tâi liệu XML ti Luận án phương pháp đánh chỉ số cho tài liệu xml tin sinh học dựa trên r tree

n sinh học.-Sư dụng phương pháp chuyền đối dừ liệu vãn bân có cấu trúc XML về dừ liệu dạng số mà biêu diễn được trên không gian 2 chiều (có thè mờ rộn

Luận án phương pháp đánh chỉ số cho tài liệu xml tin sinh học dựa trên r tree

g lèn nhiều chiều). Mục tiêu là nhằm giâm kích thước dừ liệu gốc và áp dụng được phương pháp đánh chi số đề xuất.Kết quà đạt được của luận án như sau:

1Mở ĐÀUTài liệu XML lả dữ liệu văn bân có cấu trúc, hay còn gọi là dữ liệu bán cấu trúc, chúng đà phô biến hãng thập ký nay vì khà nãng Itru trừ dừ li

Luận án phương pháp đánh chỉ số cho tài liệu xml tin sinh học dựa trên r tree tốt nói chung. Tuy nhiên, tỷ lệ nén không có có kêt quả tot đồng đều giừa các thực nghiệm với dạng tài liệu XML tin sinh học DNA, Protein, và cây phâ

n loài...4Đe xuất được phương pháp đánh chi số BioX-tree và phương pháp mớ rộng BioX+ tree. Các phương pháp đề xuất (cãi tiến phương pháp R-tree) đà c Luận án phương pháp đánh chỉ số cho tài liệu xml tin sinh học dựa trên r tree

hứng tô hiệu quã hơn phương pháp R-tree kill áp dụng đê đánh chi số dử liệu chuyến đổi từ dử liệu XML qua các thực nghiệm. Đặc biệt, các truy vấn anh

Luận án phương pháp đánh chỉ số cho tài liệu xml tin sinh học dựa trên r tree

em. hoặc các truy vấn có tận dụng truy vẩn anh em trong thuật toán, có kết quá tốt. Lý thuyết và thực nghiệm đã chứng minh được răng: các truy vấn đà

1Mở ĐÀUTài liệu XML lả dữ liệu văn bân có cấu trúc, hay còn gọi là dữ liệu bán cấu trúc, chúng đà phô biến hãng thập ký nay vì khà nãng Itru trừ dừ li

Luận án phương pháp đánh chỉ số cho tài liệu xml tin sinh học dựa trên r tree nh, mã vần có đươc kết quà như mong muốn.Hạn chế của các phương pháp đề xuất là việc cai tiến cấu trúc cây R-tree để hiệu quả hơn với các truy vấn xpa

th đà làm suy yếu cấu trúc tối tru về không gian cua phương pháp R-tree gốc. Hậu qua là. các truy vấn thông thường cua R-tree như truy vấn phạm vị (kh Luận án phương pháp đánh chỉ số cho tài liệu xml tin sinh học dựa trên r tree

ông phái truy vấn xpath), hai loại truy vấn Xpath (toàn bô) các tags trước và sau cùa một tag bắt kỳ có kết quà không tốt và thất thường, khó dự đoán.

Luận án phương pháp đánh chỉ số cho tài liệu xml tin sinh học dựa trên r tree

Tất nhiên, các truy vấn này ít ý nghĩa với các truy vấn Xpath. Nhưng đề mớ rộng phạm vi áp dung. NCS sè tiếp tục nghiên cứu sau này. Trong quá trinh

1Mở ĐÀUTài liệu XML lả dữ liệu văn bân có cấu trúc, hay còn gọi là dữ liệu bán cấu trúc, chúng đà phô biến hãng thập ký nay vì khà nãng Itru trừ dừ li

Luận án phương pháp đánh chỉ số cho tài liệu xml tin sinh học dựa trên r tree t bài báo khác, vỉ vây, trong luận án, NCS đã dồi rèn thành BioX-trcc thay cho XR-tree.

1Mở ĐÀUTài liệu XML lả dữ liệu văn bân có cấu trúc, hay còn gọi là dữ liệu bán cấu trúc, chúng đà phô biến hãng thập ký nay vì khà nãng Itru trừ dừ li

Gọi ngay
Chat zalo
Facebook