觸屏版
全國(guó)服務(wù)熱線(xiàn):0571-87205688
HITS(Hyperlink – Induced Topic Search)鏈接分析算法誕生在1997年,該算法是由康奈爾大學(xué)中的一位博士提出,并且該算法沿用于全球多個(gè)搜索引擎當(dāng)中。當(dāng)然,不同的搜索引擎針對(duì)于該算法的側(cè)重點(diǎn)和內(nèi)部公式都有不一的算法結(jié)構(gòu)調(diào)整,并且HITS算法也是鏈接分析中最為重要的基礎(chǔ)算法之一。
對(duì)于目前國(guó)內(nèi)的整體搜索引擎而言,百度作為國(guó)內(nèi)的搜索引擎領(lǐng)頭羊,我會(huì)帶著HITS的公開(kāi)文檔針對(duì)百度搜索引擎進(jìn)行多元化的角度和實(shí)驗(yàn)來(lái)深度解析HITS在SEO中的實(shí)戰(zhàn)應(yīng)用。
首先,我們先來(lái)了解一下什么是HITS算法,包括他的計(jì)算公式和算法原理以及他優(yōu)缺點(diǎn)。深刻的理解了這些含義以后,然后我們借助一些特定的實(shí)驗(yàn)來(lái)驗(yàn)證HITS的效果和實(shí)用性。
在HITS鏈接分析算法當(dāng)中,闡述最多的兩個(gè)點(diǎn)就是Hub頁(yè)面與Authority頁(yè)面。
一、什么是Authority頁(yè)面(權(quán)威頁(yè)面)
簡(jiǎn)單來(lái)說(shuō)Authority頁(yè)面(權(quán)威頁(yè)面)是指在某一個(gè)領(lǐng)域范圍內(nèi)或者某一個(gè)相關(guān)主題范圍內(nèi)的高質(zhì)量網(wǎng)頁(yè)。比如招聘領(lǐng)域,前程無(wú)憂(yōu)網(wǎng)站的首頁(yè)就是該領(lǐng)域的一個(gè)高質(zhì)量?jī)?yōu)質(zhì)網(wǎng)頁(yè)。比如淘寶首頁(yè)就是電商領(lǐng)域的優(yōu)質(zhì)網(wǎng)頁(yè)。
二、什么是Hub頁(yè)面(樞紐頁(yè)面)
而Hub頁(yè)面(樞紐頁(yè)面)通常就是它頁(yè)面本身包含了很多高質(zhì)量的Authority頁(yè)面的鏈接,比如360網(wǎng)址導(dǎo)航首頁(yè)就是一個(gè)非常好的Hub頁(yè)面(樞紐頁(yè)面)。因?yàn)樵?60網(wǎng)址導(dǎo)航的站點(diǎn)頁(yè)面里面聚合了眾多的不同類(lèi)型的權(quán)威站點(diǎn)集合,比如新聞板塊聚集了新浪、騰訊等權(quán)威站點(diǎn)。視頻板塊聚集了搜狐視頻、優(yōu)酷視頻等權(quán)威站點(diǎn)。這個(gè)點(diǎn)和大家經(jīng)常發(fā)布的一些分類(lèi)目錄網(wǎng)站外鏈有點(diǎn)類(lèi)似(所以為何網(wǎng)站目錄外鏈還存在一定的效果,正是因?yàn)樗阉饕姹旧碛凶约禾赜械乃惴ú艜?huì)影響到你的排名)。
三、HITS算法意義
之所以存在HITS算法,是因?yàn)樗阉饕嫘枰谌蛩ト〉木W(wǎng)頁(yè)文檔集合當(dāng)中找到與用戶(hù)搜索請(qǐng)求查詢(xún)?cè)~匹配度與之相關(guān)最高的頁(yè)面進(jìn)行符合匹配,而這里的匹配度相關(guān)最高的則是一些高質(zhì)量的“Authority”頁(yè)面和“Hub”頁(yè)面,而不是大家常常理解的站內(nèi)文章優(yōu)質(zhì)原創(chuàng)等因素。尤其是一些權(quán)威頁(yè)面,搜索引擎更加親耐,因?yàn)檫@類(lèi)站點(diǎn)頁(yè)面的內(nèi)容會(huì)更加滿(mǎn)足用戶(hù)查詢(xún)的內(nèi)容。
有很多朋友可能會(huì)問(wèn)到一個(gè)問(wèn)題,如何成為權(quán)威頁(yè)面或者樞紐頁(yè)面呢?
其實(shí)樞紐頁(yè)面在前面從概念意義上解釋來(lái)說(shuō)已經(jīng)告訴了大家如何去成為樞紐頁(yè)面。比如360導(dǎo)航網(wǎng)站的某一個(gè)站點(diǎn)類(lèi)型的聚合頁(yè)面,再比如網(wǎng)站分類(lèi)目錄站點(diǎn)的某一個(gè)站點(diǎn)類(lèi)型的聚合頁(yè)面,這些都屬于樞紐頁(yè)面,但是樞紐頁(yè)面也會(huì)分為高質(zhì)量樞紐頁(yè)面和一般性樞紐頁(yè)面。比如360導(dǎo)航網(wǎng)站首頁(yè)不僅是樞紐頁(yè)面并且還是導(dǎo)航站點(diǎn)的權(quán)威頁(yè)面。
那么又如何成為權(quán)威頁(yè)面呢?
這里就會(huì)提到大家想要理解的一個(gè)深層次的東西了,所謂的高權(quán)重外鏈其實(shí)可以理解為高權(quán)威外鏈,即權(quán)重=權(quán)威。搜索引擎針對(duì)每一個(gè)站點(diǎn)和該站點(diǎn)的每一個(gè)頁(yè)面都有一系列的網(wǎng)頁(yè)評(píng)分,而這類(lèi)評(píng)分決定著頁(yè)面的鏈接是否為有效的信任度。而權(quán)威頁(yè)面往往會(huì)有幾個(gè)特點(diǎn):
1、品牌屬性
不管是某一種類(lèi)型的站點(diǎn),一旦要想成為行業(yè)的權(quán)威,品牌屬性必定濃厚,這點(diǎn)大家可以從百度搜索引擎的知心算法可以得知。如當(dāng)用戶(hù)搜索網(wǎng)上商城會(huì)聯(lián)想到京東、天貓;再如當(dāng)用戶(hù)搜索空調(diào)會(huì)聯(lián)想到海爾、格力、美的等知名品牌。正是因?yàn)檫@類(lèi)品牌屬性,可以讓這類(lèi)品牌官網(wǎng)站點(diǎn)在某一個(gè)行業(yè)領(lǐng)域形成獨(dú)特的權(quán)威度。但是,對(duì)于搜索引擎而言,這類(lèi)品牌屬性搜索引擎是感觀不到的,而用戶(hù)卻可以知曉。因?yàn)閷?duì)于用戶(hù)而言,用戶(hù)可以通過(guò)報(bào)刊,電視等多媒體方式了解到這些品牌的循環(huán)曝光,從而積累品牌的印象程度。那么搜索引擎是如何計(jì)算出這些品牌屬性的權(quán)威程度呢?針對(duì)搜索引擎來(lái)說(shuō),搜索引擎會(huì)通過(guò)全網(wǎng)抓取技術(shù)檢索全球所有網(wǎng)頁(yè)集合,根據(jù)文檔檢索模型計(jì)算出詞頻,而詞頻計(jì)算出來(lái)的相關(guān)詞頻次結(jié)合度最高的一類(lèi)詞就是一個(gè)主題的符合度。通常情況下,是行業(yè)產(chǎn)品詞+品牌詞檢索。
2、歷史屬性
歷史屬性我們可以稱(chēng)之為信任度屬性,何為信任度屬性,簡(jiǎn)單的理解就是一個(gè)權(quán)威的站點(diǎn)必定是本身的頁(yè)面存在一定的真實(shí)性、可靠性的價(jià)值信任信息,就如百度百科的詞條會(huì)有對(duì)應(yīng)的參考資料來(lái)作為參考佐證,從而針對(duì)內(nèi)容進(jìn)行信任度提升。所以即使內(nèi)容不是原創(chuàng),如果頁(yè)面滿(mǎn)足了信任度屬性,你的內(nèi)容一樣非常有價(jià)值,也利于搜索引擎優(yōu)化。信任度屬性除了信息價(jià)值信任之外還有一點(diǎn)就是歷史數(shù)據(jù)積累,這點(diǎn)在老域名站點(diǎn)體現(xiàn)的非常明顯。越老的站點(diǎn)信任度屬性就體現(xiàn)的越明顯,比如做一些灰色產(chǎn)業(yè)或者做醫(yī)療的SEO人員就非常喜歡采用使用過(guò)的并且干凈底子的老域名進(jìn)行優(yōu)化效果最佳。
3、曝光屬性
權(quán)威頁(yè)面除了品牌屬性和歷史數(shù)據(jù)積累等屬性還有一點(diǎn)就是曝光屬性,這類(lèi)曝光屬性會(huì)包含兩個(gè)大類(lèi),其中是站內(nèi)曝光屬性和站外曝光屬性。站內(nèi)曝光屬性可以理解為頁(yè)面收錄量,一般情況下,當(dāng)一個(gè)域名使用了10多年,每天都在充實(shí)著一些主題非常一致的優(yōu)質(zhì)樞紐頁(yè)面的時(shí)候,那么自然而然他的曝光也會(huì)放的很大。而站外曝光屬性就是在整個(gè)互聯(lián)網(wǎng)站點(diǎn)文檔集合里面所體現(xiàn)出你品牌屬性的詞頻集合和關(guān)鍵詞主題一致的文檔數(shù)量,比如闡述淘寶的網(wǎng)頁(yè)相關(guān)結(jié)果數(shù)有X億個(gè)網(wǎng)頁(yè)。而X億張網(wǎng)頁(yè)集合里面和淘寶相關(guān)度最密切的是關(guān)于電商、商城、網(wǎng)購(gòu)等主題行業(yè)詞匯。那么通過(guò)歷史屬性的數(shù)據(jù)積累,淘寶站點(diǎn)在電商領(lǐng)域歸屬于權(quán)威站點(diǎn)。
四、HITS算法缺陷
每個(gè)搜索引擎算法都有自己的優(yōu)勢(shì)和缺陷,HITS也不例外,在HITS算法當(dāng)中,有4個(gè)最常見(jiàn)的缺陷,其中包含了計(jì)算效率低、主題漂移、容易作弊和結(jié)構(gòu)不穩(wěn)定。
由于HITS算法是與之查詢(xún)相關(guān)的算法,所以不能先計(jì)算,而必須是用戶(hù)請(qǐng)求了某一個(gè)搜索詞以后才能去計(jì)算該詞的一些站點(diǎn)文檔匹配度(鏈接評(píng)分板塊),加上HITS算法的計(jì)算屬性需要通過(guò)多次的計(jì)算迭代才能最終計(jì)算出檢索結(jié)果的文檔鏈接的推薦度投票,所以導(dǎo)致計(jì)算效率比較低下。
而主題漂移問(wèn)題則是大家常??梢钥吹搅艘恍┈F(xiàn)象,即使我交換的鏈接和我站點(diǎn)主題沒(méi)有一條相關(guān),但是也會(huì)促進(jìn)我的頁(yè)面關(guān)鍵詞排名提升。而這種現(xiàn)象正是因?yàn)镠ITS的特殊算法結(jié)構(gòu)才出現(xiàn)了給與這些無(wú)關(guān)網(wǎng)頁(yè)很高的排名。最終導(dǎo)致了搜索結(jié)果發(fā)生了主題漂移,而這種現(xiàn)象也稱(chēng)為“緊密鏈接社區(qū)現(xiàn)象”。
要做到百度收錄快,蹭熱度不如有內(nèi)容
當(dāng)下對(duì)于seo排名方法的總結(jié)建議
seo高手是如何快速排名百度首頁(yè)?
企業(yè)產(chǎn)品網(wǎng)站三個(gè)月關(guān)鍵詞排名上首頁(yè),農(nóng)村包圍城市
企業(yè)網(wǎng)站被搜索引擎收錄的幾個(gè)影響因素
網(wǎng)站內(nèi)存在大量死鏈接,對(duì)熊掌號(hào)有什么影響?
網(wǎng)站被“判罰”,會(huì)影響熊掌號(hào)嗎?
談SEO高手都不知道的SEO三大謊言
始終保持你網(wǎng)站的關(guān)鍵字精簡(jiǎn)并且有關(guān)聯(lián)性
淺談SEO中tag標(biāo)簽的重要性
評(píng)論(0人參與,0條評(píng)論)
發(fā)布評(píng)論
最新評(píng)論