搜索引擎的工作主要由哪兩部分組成?

2023-05-23 02:30

急!謝謝各位!
4個回答
搜索引擎的主要工作流程是:首先從蜘蛛開始,蜘蛛程序每隔一定的時間,自動啟動并讀取網(wǎng)頁URL服務器上的URL列表,按深度優(yōu)先或廣度優(yōu)先算法,抓取各URL所指定的網(wǎng)站,將抓取的網(wǎng)頁分配一個唯一文檔ID(DocId),存入文檔數(shù)據(jù)庫。一般在存入文檔數(shù)據(jù)庫之前進行一定的壓縮處理。并將當前頁上的所的超連接存入到URL服務器中。在進行抓取的同時,切詞器和索引器將已經(jīng)抓取的網(wǎng)頁文檔進行切詞處理,并按詞在網(wǎng)頁中出現(xiàn)的位置和頻率計算權(quán)值,然后將切詞結(jié)果存入索引數(shù)據(jù)庫。整個抓取工作和索引工作完成后更新整個索引數(shù)據(jù)庫和文檔數(shù)據(jù)庫,這樣用戶就可以查詢最新的網(wǎng)頁信息。查詢器首先對用戶輸入的信息進行切詞處理,并檢索出所有包含檢索詞的記錄,通過計算網(wǎng)頁權(quán)重和級別對查詢記錄進行排序并進行集合運算,最后從文檔數(shù)據(jù)庫中提取各網(wǎng)頁的摘要信息反饋給查詢用戶。
鼠標和鍵盤~
想個名字到頭大
你的回答太對了
搜索引擎的工作原理:
1.爬行和抓取:首先搜索引擎會派出搜索引擎蜘蛛爬行網(wǎng)站并將網(wǎng)站的內(nèi)容抓取出來。
2.存儲:抓取出來的內(nèi)容存儲在臨時數(shù)據(jù)庫中
3.預處理:存儲下來的內(nèi)容再進行處理環(huán)節(jié),選擇自己喜歡的內(nèi)容
4.建立索引:搜索引擎會把處理好的內(nèi)容放到索引數(shù)據(jù)庫,從而方便后期找到自己匹配的關鍵詞
5.排序:最后就是將搜索出來的結(jié)果通過網(wǎng)頁的形式排列出來
相關問答
搜索引擎的組成是什么?
1個回答2022-08-13 02:35
搜索引擎一般由搜索器、索引器、檢索器和用戶接口四個部分組成; 其作用是接納用戶查詢、顯示查詢結(jié)果、提供個性化查詢項。
搜索引擎 元搜索引擎 區(qū)別
1個回答2022-09-20 03:59
【目錄式搜索引擎】 優(yōu)點:收錄網(wǎng)站質(zhì)量高 全人工審核 缺點:死鏈接較多 【全文搜索引擎】 優(yōu)點:信息及時 又多 缺點:根據(jù)各站的技術判定 在此不評論 【元搜索引擎】 優(yōu)點:方便簡單快捷 ...
全文
搜索引擎的索引工作是由什么完成的
1個回答2023-05-12 18:11
搜索引擎蜘蛛
什么是搜索引擎?
2個回答2022-12-05 07:31
大數(shù)據(jù)時代,如何幫助用戶從海量信息中快速準確搜索到目標內(nèi)容,就需要搜索引擎。大數(shù)據(jù)搜索引擎是一個提供分布式,高性能、高可用、可伸縮的搜索和分析系統(tǒng)。 目前常見的搜索引擎技術如下:Elasticsear...
全文
什么么是搜索引擎?
1個回答2022-12-06 05:42
搜索引擎就是給用戶提供一個搜索的平臺,用戶輸入搜索關鍵字后,平臺會自動檢索出所有的相關信息
有哪些好用的搜索引擎?
1個回答2022-12-30 15:51
現(xiàn)在用的最多的是火狐
搜索引擎分為哪幾類?
1個回答2023-05-23 01:08
新課件及行走
搜索引擎是怎么工作的
1個回答2023-05-20 06:40
網(wǎng)絡搜索爬蟲
我想在手機上看小說,那個手機搜索引擎比較好。
1個回答2022-06-19 11:27
飛庫手機電子書比較好
熱門問答