Tiểu luận phân cụm tập kết quả tìm kiếm web dựa vào tập thô dung sai
➤ Gửi thông báo lỗi ⚠️ Báo cáo tài liệu vi phạmNội dung chi tiết: Tiểu luận phân cụm tập kết quả tìm kiếm web dựa vào tập thô dung sai
Tiểu luận phân cụm tập kết quả tìm kiếm web dựa vào tập thô dung sai
Phân cụm tập kết quá tìm kiềm web dựa vào tập thó dung saiLỜI MỎ ĐÂUNgày nay vói sự bùng nồ thòng tin , Word Wide Web(www) trờ thành nguồn tài nguyên Tiểu luận phân cụm tập kết quả tìm kiếm web dựa vào tập thô dung sai không lồ và quý giá. Nó cung cấp cho chúng ta thông tin về mọi lình vực đời sống xà hôi, khoa học v.v... Tuy nhiên đi đôi với sự thuận lợi ấy có một vấn để được đặt ra là chúng ta làm thế nào đê truy cập và khai phá được nguồn tài nguyên ấy hiệu quả nhất.Từ vấn đề trên người ta đã nghiên cứu và tạo Tiểu luận phân cụm tập kết quả tìm kiếm web dựa vào tập thô dung sai ra Máy truy tìm \veb(Web search engine). Máy này có khả năng tìm kiêm thòng tin linh hoạt. nhanh chóng và rất dề sứ dụng . Người sứ dụng chì cằn đặtTiểu luận phân cụm tập kết quả tìm kiếm web dựa vào tập thô dung sai
câu hôi truy vấn về vấn đề cần quan tâm là có được tập kết quâ hên quan đến câu hôi truy vấn đó Hiện nay Google1. Altavista2, HotBot3, Lycos4, AUTheWePhân cụm tập kết quá tìm kiềm web dựa vào tập thó dung saiLỜI MỎ ĐÂUNgày nay vói sự bùng nồ thòng tin , Word Wide Web(www) trờ thành nguồn tài nguyên Tiểu luận phân cụm tập kết quả tìm kiếm web dựa vào tập thô dung sai r)' Project" Theo kiêu này thi các tài liệu Web được sắp xếp thành các thư có phân cấp. người sư dung có thế tun thông tin bắng cách duyệt các cây thư mục và xác định tài liệu minh cần tìm.Thế nhimg việc tìm kiếm thông tin theo những kiêu trên vẫn không hiệu quả , chiếm nhiều thời gian vì:-Khối lượn Tiểu luận phân cụm tập kết quả tìm kiếm web dựa vào tập thô dung sai g dừ liêu không lồ và tinh động của các trang Web, nên máy truy tim chí có thê sap xếp một phần các chi mục cùa Web.-Người sứ dụng đặt câu hói truy vấTiểu luận phân cụm tập kết quả tìm kiếm web dựa vào tập thô dung sai
n quá ngắn, không thê hiện được hết ý định của họ . do vậy mà tập kết quà tim kiem Web là chung chung.Từ anh hưởng hai nhân tố trên tập kết quả tim kiPhân cụm tập kết quá tìm kiềm web dựa vào tập thó dung saiLỜI MỎ ĐÂUNgày nay vói sự bùng nồ thòng tin , Word Wide Web(www) trờ thành nguồn tài nguyên Tiểu luận phân cụm tập kết quả tìm kiếm web dựa vào tập thô dung sai ://ww.altavista.ccz: ' http://ww.hotbot.con 4 http://ww.lycos.ccm1 http://ww.alltheweb.ccci4 http://ww.yahco.ccmhttp://ww.dmoz. org11Phán cụm tập kết quà tìm kiềm web dựa vào tập thô dung saiCHƯƠNG IVẤN ĐÊ TÌM KIẾM THÔNG TIN TRÊN WEBNhư chúng ta đều biết WWW như là từ điển bách khoa toàn thư . Là th Tiểu luận phân cụm tập kết quả tìm kiếm web dựa vào tập thô dung sai ư viện không lồ sẵn sàng phục \-ụ bắt cứ ai quan tâm thông qua việc truy cập internet. Đối với chúng ta nó là một trong những nguồn tài nguyên thông tTiểu luận phân cụm tập kết quả tìm kiếm web dựa vào tập thô dung sai
in có giá trị nhất, nếu không có nó thi mọi hoạt động hang ngây sỗ kém hiệu quà. Nhưng vấn đề đặt ra lả chùng ta phái truy cập và sử dụng nguồn tâi ngPhân cụm tập kết quá tìm kiềm web dựa vào tập thó dung saiLỜI MỎ ĐÂUNgày nay vói sự bùng nồ thòng tin , Word Wide Web(www) trờ thành nguồn tài nguyên Tiểu luận phân cụm tập kết quả tìm kiếm web dựa vào tập thô dung sai n nay đà và đang có rat nhiêu hướng nghiền cửu đè giải quyết van đề này.1.1.Máy truy tìm WebMột trong nhùng thành còng nhất trong nghiên cứu và giài quyết van đe trên Là việc tạo ra được máy truy tìm Web. Máy này có nhiệm vụ giúp người sư dụng tìm tài liệu minh quan tâm. Các lãi liệu chú yếu có dạng Tiểu luận phân cụm tập kết quả tìm kiếm web dựa vào tập thô dung sai HTML. PDF. PS, MS Word và MS PowerPoint.Giao diện máy truy tìm thân thiên và rất dề sư dung . người sử dung chi can đột câu hói truy vấnvà ra lệnh tiTiểu luận phân cụm tập kết quả tìm kiếm web dựa vào tập thô dung sai
m Máy sè trá về tập kết quá tim kiếm(được gọi Là các sinppet) hên quan đến câu hòi truy van đó Snippet miêu tá ngan gọn nội dung của tài liệu Web(tranPhân cụm tập kết quá tìm kiềm web dựa vào tập thó dung saiLỜI MỎ ĐÂUNgày nay vói sự bùng nồ thòng tin , Word Wide Web(www) trờ thành nguồn tài nguyên Tiểu luận phân cụm tập kết quả tìm kiếm web dựa vào tập thô dung sai rúc và phưo-ng thức hoạt động cùa máy truy tìm Web như sau:Phán cụm tập kết quả tìm kiếm web dựa vào tập thó dung saiSearutiEngine1.1.1.Web CrawlerWeb Crawler là một trong hai thành phần trực tiếp nrong tác VÓI internet, nó còn được gọi là web spider hoặc robot. Công việc chỉnh của Web Crawler là ph Tiểu luận phân cụm tập kết quả tìm kiếm web dựa vào tập thô dung sai át hiện nhùng nguồn tài nguyên mới trên Web Nó giãi quyết vấn đề này bằng cách thực hiên tìm kiếm đệ quy theo các đường link từ tất cả các trang đà đưTiểu luận phân cụm tập kết quả tìm kiếm web dựa vào tập thô dung sai
ợc duyệt.Trong khi khai phá các nguồn tài nguyên mới trên Internet, Web Crawler còn có nhiệm vụ kiêm tra xem các trang có côn hợp lệ không và chúng taPhân cụm tập kết quá tìm kiềm web dựa vào tập thó dung saiLỜI MỎ ĐÂUNgày nay vói sự bùng nồ thòng tin , Word Wide Web(www) trờ thành nguồn tài nguyên Tiểu luận phân cụm tập kết quả tìm kiếm web dựa vào tập thô dung sai 1.2.Document Index (lập chi mục tài liệu)Mục đích chính cùa việc lập chi mục lài liệu là ho trợ tìm kiêm, rim lài liệu có chửa nhùng lù trong câu hôi truy vân? Dê thực hiện còng việc này ihì đa sô các máy truy lìm sứ dụng biên dữ liệu có càu trúc inverted index. Inverted index giống như danh sách ch Tiểu luận phân cụm tập kết quả tìm kiếm web dựa vào tập thô dung sai i mục ở phần cuối cùa cuốn sách - trong dó VỚI mồi một từ là một danh sách liên kềt các tài liệu có tử dó xuất hiện. Biến này có khã năng giúp máy truTiểu luận phân cụm tập kết quả tìm kiếm web dựa vào tập thô dung sai
y tìm xác định chinh xác tài liệu có chứa các từ trong câu hoi truy vấn. VóiPhân cụm ỉập kết quá tim kiềm yveb dựa vào tập thó dung saibâng chi mục nhPhân cụm tập kết quá tìm kiềm web dựa vào tập thó dung saiLỜI MỎ ĐÂUNgày nay vói sự bùng nồ thòng tin , Word Wide Web(www) trờ thành nguồn tài nguyên Phân cụm tập kết quá tìm kiềm web dựa vào tập thó dung saiLỜI MỎ ĐÂUNgày nay vói sự bùng nồ thòng tin , Word Wide Web(www) trờ thành nguồn tài nguyênGọi ngay
Chat zalo
Facebook