百度如如何判斷頁面關(guān)鍵詞的?
大部分SEO在考慮這個問題時候往往會SEO為出發(fā)點,感覺百度就是通過自己布局關(guān)鍵詞的幾個地方來判斷頁面關(guān)鍵詞的。拋開SEO,假設一個網(wǎng)站沒有做SEO,任何SEO細節(jié)都沒考慮,甚至頁面沒有title、H1、加粗之類的標簽,但是頁面中有多用戶十分有用的內(nèi)容(比如一些政府網(wǎng)站或組織機構(gòu)網(wǎng)站),那么百度還需要索引這樣的網(wǎng)站和頁面嗎?還需要判斷這些頁面的關(guān)鍵詞嗎?答案顯然是需要的。那么這些在大眾眼中重要的SEO位置沒有布局關(guān)鍵詞的頁面,百度還能判斷其核心關(guān)鍵詞嗎?答案當然是“可以的”,不然百度和其他搜索引擎都沒有價值了。
搜索引擎判斷頁面的核心關(guān)鍵詞時,會比較注重頁面的title、H標簽、內(nèi)容中加粗變色標簽、主體考前部分關(guān)鍵詞出現(xiàn)的頻率等,但是這并不是搜索引擎判斷頁面關(guān)鍵詞的主要渠道,而只是促進搜索引擎認為這個頁面和SEO人員在這些地方布局的關(guān)鍵詞更先關(guān)而言。從在采集內(nèi)容中硬性插入關(guān)鍵詞,單純以頁面幾個重要地方著重關(guān)鍵詞和硬性提升內(nèi)容中關(guān)鍵詞的密度的所謂“偽原創(chuàng)”已經(jīng)失效,就可以了解到搜索引擎并不只是根據(jù)大眾SEO所注重的積分地方來判斷關(guān)鍵詞的。
搜索引擎判斷一個頁面的核心關(guān)鍵詞步驟
1、抽取頁面內(nèi)容部分,對內(nèi)容進行分詞處理;2、根據(jù)各個關(guān)鍵詞在頁面中的頻率和在全網(wǎng)中的頻率來判斷哪些關(guān)鍵詞是該頁面的主要關(guān)鍵詞,這里一般使用的是TF-IDF及其改進的算法;3、根據(jù)根據(jù)更為先進的語義識別算法判斷;4、把頁面的title、H標簽、內(nèi)容開頭部分內(nèi)容(有時甚至只是一句話)、內(nèi)容加粗變色文字中所提取出的關(guān)鍵詞與其他算法判定的關(guān)鍵詞進行加權(quán)計算,從而最終得到這個頁面和那些關(guān)鍵詞相關(guān),并按照相關(guān)度吧關(guān)鍵詞進行排序,前幾個關(guān)鍵詞一般就可以被判定為該頁面的核心關(guān)鍵詞。
總結(jié):百度判斷一個頁面的核心關(guān)鍵詞一些需要注意的地方有、標題、文章內(nèi)容、關(guān)鍵詞密度、文章使用的H標簽、描文本標簽、加粗加顏色、下劃線、網(wǎng)頁中經(jīng)常出現(xiàn)的詞等方面。作為SEO的指導是:需要特別注意在頁面重要位置和標簽內(nèi)容突出我們心中的核心關(guān)鍵詞,但是需要注重內(nèi)容自然建設,而不是為了堆積關(guān)鍵詞二堆積關(guān)鍵詞,不能把工作重心本末倒置。