複製鏈接
請複製以下鏈接發送給好友

索引庫

鎖定
索引庫就類似於我們查字典時候的檢索表,或者是圖書館的書目檢索。Google的蜘蛛在抓取網頁之後,就把這些頁面放到對應的索引庫裏面。在用户搜索的時候,只需要到相應的檢索庫裏面搜索相應的信息,而不是從所有的頁面當中。
中文名
索引庫
類似於
我們查字典時候的檢索表
分類根據
詞語
分類方式
索引庫裏用詞語來分類。因為儘管互聯網上的網頁是不斷激增的,但是每一種語言裏,詞語的數量都是相對固定的。比如英語就是一百多萬個單詞,100億 ÷ 1百萬 = 1 萬;漢語是8萬多個詞語,100億÷8萬=12萬5千。都是計算機很容易處理得過來的。
索引庫的分類方式 索引庫的分類方式
用詞語來分類還有一個好處,就是可以匹配用户查詢的那個詞語。本來用户就是要查這個詞語的,那我就按這個詞語去分類就是。所以,搜索引擎的索引庫,最後就是這個樣子的: