複製鏈接
請複製以下鏈接發送給好友

阿拉丁計劃

鎖定
阿拉丁計劃是新一代搜索引擎。阿拉丁是搜索引擎公司百度推出的一個通用開放平台,它將接口開放給獨特信息數據的擁有者,從而解決現有搜索引擎無法抓取和檢索的暗網信息。
中文名
阿拉丁計劃
概    述
阿拉丁計劃是新一
阿拉丁計劃
用阿拉丁計劃命名,寓含着
為什麼推出
能被搜索引擎檢索到的信

目錄

阿拉丁計劃定義

用阿拉丁計劃命名,寓含着百度的這個平台可以像神燈那樣幫助用户實現最便捷地獲取信息的願望。

阿拉丁計劃意義

能被搜索引擎檢索到的信息只佔所有信息中非常小的一部分,大部分信息存沒有被任何搜索引擎編列索引,以至於無法通過搜索引擎找到他們。這些未被收錄的信息即在“暗網”之中。
要明白為什麼推出百度百度阿拉丁計劃?先來簡單瞭解下“暗網 [1]  ”的分類。
1、由於技術的原因,很多網站本身不規範、或者説互聯網本身缺少統一規則,導致了搜索引擎的爬蟲無法識別這些網站內容並抓取,這不是搜索引擎自身就能解決的問題,而是有賴整個網絡結構的規範化。
2、很多網站因多種原因根本就不願意被搜索引擎抓取,robots屏蔽了搜索引擎的抓取。第二種暫且不做研究,因如果搜索引擎去抓取那些信息就屬於違法了。
“暗網”包含100億個不重複的表單,其包含的信息量是“非暗網”的40倍,有效高質內容總量至少是後者的1000倍到2000倍。
如何能將這些允許被搜索卻因網站不規範原因而未被搜索的網站的有用信息呈現給大家呢?百度“阿拉丁計劃”就是要從根本解決這一問題的。
正是認識到“暗網”信息的存在和巨大價值,百度開始着手啓動“阿拉丁平台”研發計劃,期望能挖掘出更多存在於“暗網”之中的有價值信息,將更多的已知和未知信息分門別類融合,有序納入搜索體系。

阿拉丁計劃含義

阿拉丁計劃旨在超越現有Web內容的限制,對包括眾多未納入搜索引擎檢索體系的“暗網”在內的所有信息進行更深一步的分析、融合、處理,以使這些信息能最富有效率地被用户通過搜索引擎進行檢索,從而逐步實現“只在一個最為簡單的搜索框裏面,藴藏了全人類最為豐富多彩的信息世界!
阿拉丁計劃 阿拉丁計劃
大大增加對用户有用信息的可讀性。即所謂照亮“暗海”。
參考資料