複製鏈接
請複製以下鏈接發送給好友

TrustRank算法

鎖定
TrustRank算法是早年基於鏈接關係的排名算法。TrustRank可以翻譯為“信任指數”。
中文名
TrustRank算法
類    別
基於鏈接關係的排名算法
最初來來源
斯坦福大學和雅虎的一項聯合研究
備    註
算法並不是由Google提出的

TrustRank算法算法簡介

TrustRank算法
TrustRank算法最初來自於2004年斯坦福大學和雅虎的一項聯合研究,用來檢測垃圾網站,並且於2006年申請專利。TrustRank算法發明人還發表了一份專門的PDF文件,説明TrustRank算法的應用。感興趣的讀者可以在下面這個網址下載PDF文件:
TrustRank算法並不是由Google提出的,不過由於Google所佔市場份額最大,而且TrustRank在Google排名中也是一個非常重要的因素,所以有些人誤以為TrustRank是Google提出的。更讓人糊塗的是,Google曾經把TrustRank申請為商標,但是TrustRank商標中的TrustRank指的是Google檢測含有惡意代碼網站的方法,而不是指排名算法中的信任指數。
基於這個假設,如果能挑選出可以百分百信任的網站,這些網站的TrustRank評為最高,這些trustrank最高的網站所連接的網站信任指數稍微降低,但也會很高。與此類似,第二層別信任的網站鏈接出去的第三層網站,信任度繼續下降。由於種種原因,好的網站也不可避免的會接到一些垃圾網站,不過離第一層網站點擊距離越近,所傳遞的信任指數就越高,第一級網站點擊距離越遠,信任指數將依次下降。這樣trustrank算法,就能給所有網站計算出相應的信任指數,離第一層網站越遠,成為垃圾網真的可能性就越大。

TrustRank算法算法描述

計算TrustRank值首先要選擇一批種子網站,然後人工查看網站,設定一個初始TrustRank值。挑選種子網站有兩種方式,一種是選擇導出鏈接最多的網站,因為TrustRank算法就是計算指數隨着導出鏈接的衰減,導出鏈接多的網站,在某種意義上可以理解為“逆向PR值”比較高。
另一種挑選種子網站的方法是選PR值高的網站,因為PR值越高,在搜索結果頁面出現的概率就越大,這些網站才正是TrustRank算法最關注的、需要調整排名的網站,那些PR值很低的頁面,在沒有TrustRank算法時排名也很靠後,計算TrustRank意義就不大了。
根據測算,挑選出兩百個左右網站作為種子,就可以比較精確地計算出所有網站的TrustRank值。
計算TrustRank隨鏈接關係減少的公式有兩種方式。一種是隨鏈接次數衰減,也就是説如果第一層頁面TrustRank指數是100,第二層頁面衰減為90,第三層衰減為80。第二種計算方法是按導出鏈接數目分配TrustRank值,也就是説,如果一個頁面的TrustRank值是100,頁面上有5個導出鏈接,每個鏈接將傳遞20%的TrustRank值。衰減和分配這兩種計算方法通常綜合使用,整體效果都是隨着鏈接層次的增加,TrustRank值逐步降低.
得出網站和頁面的TrustRank值後,可以通過兩種方式影響排名。一種是把傳統排名算法挑選出的多個頁面,根據TrustRank值比較,重新做排名調整。另一種是設定一個最低的TrustRank值門檻,只有超過這個門檻的頁面,才被認為有足夠的質量進入排名,低於門檻的頁面將被認為是垃圾頁面,從搜索結果中過濾出去。
雖然TrustRank算法最初是作為檢測垃圾的方法,但在的搜索引擎排名算法中,TrustRank概念使用更為廣泛,常常影響大部分網站的整體排名,TrustRank算法最初針對的是頁面級別。在搜索引擎算法中,TrustRank值也通常表現在域名級別,整個域名的信任指數越高,整體排名能力就越強。