觸屏版
全國(guó)服務(wù)熱線:0571-87205688
登錄
注冊(cè)
客戶中心
關(guān)注云客
HITS算法是一個(gè)非常常見的算法,無數(shù)的seoer都了解或者閱讀過百度百科,不過,對(duì)于HITS算法的深層次理解的人想來卻不是很多,例如最近在光年論壇上討論的兩個(gè)帖子,一個(gè)人是Hub主題確定處理現(xiàn)象,就是說首頁由于內(nèi)頁的一個(gè)鏈接,導(dǎo)致在搜索內(nèi)頁title時(shí)候出現(xiàn)結(jié)果卻是首頁http://www.baidu.com/thread-15-1-1.html,另一個(gè)是GSA的測(cè)試http://www.baidu.com/thread-12-1-1.html,得出來的結(jié)果是含有錨鏈接的詞域降低了TF。其實(shí)仔細(xì)想下,這兩個(gè)現(xiàn)象都是和hits算法有關(guān)的,第二個(gè)的結(jié)論也是錯(cuò)誤的,第一個(gè)的說法也沒有說道實(shí)質(zhì)上。不信,你可以仔細(xì)閱讀下HITS算法就知道了。
說到HITS算法,我們可以說到兩個(gè)值authority值與hub值的問題,一個(gè)是內(nèi)容質(zhì)量權(quán)威度一個(gè)是鏈接質(zhì)量權(quán)威度(個(gè)人為了容易區(qū)分)。HITS算法最大的優(yōu)勢(shì)是基于主題關(guān)鍵詞的計(jì)算,相對(duì)于PR僅僅計(jì)算鏈接關(guān)系來說,降低了內(nèi)容挖掘和結(jié)構(gòu)挖掘的量度,但是由于關(guān)系的復(fù)雜性和人為因素的影響,hits算法也有非常多的盲點(diǎn)和缺憾,其中最重要的有4點(diǎn)問題:
1,Hub主題難以確定-authority的主題漂移
由于hub頁面的主題是由鏈向的頁面確定的,很多時(shí)候鏈向頁面的主題是非常復(fù)雜的,這樣就導(dǎo)致了主題的多樣性,例如光年論壇的第一個(gè)問題就是最好的證明。而且這種指向有時(shí)候是非常多的,導(dǎo)致首頁的hub權(quán)重也非常高,影響就非常大。被指向的頁面也會(huì)出現(xiàn)這樣的事情,最常見的就是主題漂移。
其實(shí)解決這個(gè)問題,最好的辦法是加大meta標(biāo)簽的權(quán)重,但是現(xiàn)實(shí)上并不理想,另外的方法就是降低hub頁面的hub權(quán)重。(看到資料上有人說采用平均值降低hub頁面的hub值,個(gè)人覺得很無語。谷歌PR修正算法中其實(shí)已經(jīng)涉及到權(quán)重值的分配問題,所以剩下的就是主題性的確定,百度對(duì)于這個(gè)技術(shù)確實(shí)不行,所以很容易出現(xiàn)這些事情也是正常的。)
評(píng)論(0人參與,0條評(píng)論)
發(fā)布評(píng)論
最新評(píng)論