外鏈是搜索引擎算法中,判斷網(wǎng)站權重高低的重要指標,當用戶在搜索框中輸入關鍵時,搜索引擎面對大量擁有相同內容的網(wǎng)頁,首先需要解決的就是,通過哪些參數(shù)覺得網(wǎng)頁排名的高低.今天,筆者就簡單介紹外鏈建設中,比較有名的核心算法:PageRank算法、Hilltop算法、Direct Hit 算法.
第一種算法、PageRank算法
1998年,Sergey Brin和Lawrence Page提出了PageRank算法.該算法基于"從許多優(yōu)質的網(wǎng)頁鏈接過來的網(wǎng)頁,必定還是優(yōu)質網(wǎng)頁"的回歸關系,來判定網(wǎng)頁的重要性.該算法認為從網(wǎng)頁A導向網(wǎng)頁B的鏈接可以看作是頁面A對頁面B的支持投票,根據(jù)這個投票數(shù)來判斷頁面的重要性.當然,不僅僅只看投票數(shù),還要對投票的頁面進行重要性分析,越是重要的頁面所投票的評價也就越高.根據(jù)這樣的分析,得到了高評價的重要頁面會被給予較高的PageRank值,在檢索結果內的名次也會提高.PageRank是基于對"使用復雜的算法而得到的鏈接構造" 的分析,從而得出的各網(wǎng)頁本身的特性.
分析:PageRank算法的優(yōu)點在于它對互聯(lián)網(wǎng)上的網(wǎng)頁給出了一個全局的重要性排序,并且算法的計算過程是可以離線完成的,這樣有利于迅速響應用戶的請求.不過,其缺點在于主題無關性,沒有區(qū)分頁面內的導航鏈接、廣告鏈接和功能鏈接等,容易對廣告頁面有過高評價;另外,PageRank算法的另一弊端是,舊的頁面等級會比新頁面高,因為新頁面,即使是非常好的頁面,也不會有很多鏈接,除非他是一個站點的子站點.這就是PageRank需要多項算法結合的原因.
第二種算法、Hilltop算法
HillTop,是一項搜索引擎結果排序的專利,是Google的一個工程師Bharat在2001年獲得的專利.HillTop算法的指導思想和PageRank是一致的,即都通過反向鏈接的數(shù)量和質量來確定搜索結果的排序權重.但HillTop認為只計算來自具有相同主題的相關文檔鏈接對于搜索者的價值會更大,即主題相關網(wǎng)頁之間的鏈接對于權重計算的貢獻比主題不相關的鏈接價值要更高.在1999-2000年,當這個算法被Bharat與其他Google開發(fā)人員開發(fā)出來的時候,他們稱這種對主題有影響的文檔為"專家"文檔,而只有從這些專家文檔頁面到目標文檔的鏈接決定了被鏈接網(wǎng)頁"權重得分"的主要部分.
Hilltop算法的過程:首先計算查詢主題最相關的"專家"資源列表;其次在選中的"專家"集中識別相關的鏈接,并追蹤它們以識別相關的網(wǎng)頁目標;然后將目標根據(jù)非關聯(lián)的指向它們的"專家"數(shù)量和相關性排序.由此,目標網(wǎng)頁的得分反映了關于查詢主題的最中立的專家的集體觀點.如果這樣的專家池不存在,Hilltop不會給出結果.
從Hilltop算法過程可見,該算法包括兩個主要的方面:尋找專家;目標排序.通過對搜索引擎抓取的網(wǎng)頁進行預處理,找出專家頁面.對于一個關鍵詞的查詢,首先在專家中查找,并排序返回結果.
權威頁面是對于一個查詢主題來說最好的專家指向的頁面.專家也有可能在更寬泛的領域或其它領域的主題上也是專家.在專家頁面中只有一部分鏈接與主題相關.因此,把查詢主題的專家中相關的外向鏈接合并,以找到查詢主題相關頁面高度認可的頁面.
評論(0人參與,0條評論)
發(fā)布評論
最新評論