觸屏版
全國服務(wù)熱線:0571-87205688
登錄
注冊
客戶中心
關(guān)注云客
好啦,上面我們說了影響B(tài)aiduspider正常抓取的原因,下面就要說說Baiduspider的一些判斷原則了。在建庫環(huán)節(jié)前,Baiduspide會對頁面進(jìn)行初步內(nèi)容分析和鏈接分析,通過內(nèi)容分析決定該網(wǎng)頁是否需要建索引庫,通過鏈接分析發(fā)現(xiàn)更多網(wǎng)頁,再對更多網(wǎng)頁進(jìn)行抓取——分析——是否建庫&發(fā)現(xiàn)新鏈接的流程。理論上,Baiduspider會將新頁面上所有能“看到”的鏈接都抓取回來,那么面對眾多新鏈接,Baiduspider根據(jù)什么判斷哪個更重要呢?兩方面:
第一,對用戶的價值:
1,內(nèi)容獨(dú)特,百度搜索引擎喜歡unique的內(nèi)容
2,主體突出,切不要出現(xiàn)網(wǎng)頁主體內(nèi)容不突出而被搜索引擎誤判為空短頁面不抓取
3,內(nèi)容豐富
4,廣告適當(dāng)
第二,鏈接重要程度:
1,目錄層級——淺層優(yōu)先
2,鏈接在站內(nèi)的受歡迎程度
Baiduspider抓了多少頁面并不是最重要的,重要的是有多少頁面被建索引庫,即我們常說的“建庫”。眾所周知,搜索引擎的索引庫是分層級的,優(yōu)質(zhì)的網(wǎng)頁會被分配到重要索引庫,普通網(wǎng)頁會待在普通庫,再差一些的網(wǎng)頁會被分配到低級庫去當(dāng)補(bǔ)充材料。目前60%的檢索需求只調(diào)用重要索引庫即可滿足,這也就解釋了為什么有些網(wǎng)站的收錄量超高流量卻一直不理想。
那么,哪些網(wǎng)頁可以進(jìn)入優(yōu)質(zhì)索引庫呢。其實總的原則就是一個:對用戶的價值。包括卻不僅于:
1,有時效性且有價值的頁面:在這里,時效性和價值是并列關(guān)系,缺一不可。有些站點(diǎn)為了產(chǎn)生時效性內(nèi)容頁面做了大量采集工作,產(chǎn)生了一堆無價值面頁,也是百度不愿看到的.
2,內(nèi)容優(yōu)質(zhì)的專題頁面:專題頁面的內(nèi)容不一定完全是原創(chuàng)的,即可以很好地把各方內(nèi)容整合在一起,或者增加一些新鮮的內(nèi)容,比如觀點(diǎn)和評論,給用戶更豐富全面的內(nèi)容。
3,高價值原創(chuàng)內(nèi)容頁面:百度把原創(chuàng)定義為花費(fèi)一定成本、大量經(jīng)驗積累提取后形成的文章。千萬不要再問我們偽原創(chuàng)是不是原創(chuàng)。
4,重要個人頁面:這里僅舉一個例子,科比在新浪微博開戶了,即使他不經(jīng)常更新,但對于百度來說,它仍然是一個極重要的頁面。
上述優(yōu)質(zhì)網(wǎng)頁進(jìn)了索引庫,那其實互聯(lián)網(wǎng)上大部分網(wǎng)站根本沒有被百度收錄。并非是百度沒有發(fā)現(xiàn)他們,而是在建庫前的篩選環(huán)節(jié)被過濾掉了。那怎樣的網(wǎng)頁在最初環(huán)節(jié)就被過濾掉了呢:
1, 重復(fù)內(nèi)容的網(wǎng)頁:互聯(lián)網(wǎng)上已有的內(nèi)容,百度必然沒有必要再收錄。
2, 主體內(nèi)容空短的網(wǎng)頁
1)有些內(nèi)容使用了百度spider無法解析的技術(shù),如JS、AJAX等,雖然用戶訪問能看到豐富的內(nèi)容,依然會被搜索引擎拋棄
2)加載速度過慢的網(wǎng)頁,也有可能被當(dāng)作空短頁面處理,注意廣告加載時間算在網(wǎng)頁整體加載時間內(nèi)。
3)很多主體不突出的網(wǎng)頁即使被抓取回來也會在這個環(huán)節(jié)被拋棄。
3, 部分作弊網(wǎng)頁
B2B網(wǎng)站網(wǎng)站SEO優(yōu)化的問題
搜索引擎優(yōu)化或社會媒體的選擇
淺談如何降低網(wǎng)站跳轉(zhuǎn)率
新手應(yīng)該學(xué)習(xí)老手的SEO經(jīng)驗
提高個人博客知名度的五大方法
揭秘白帽SEO快速排名優(yōu)化操作手法
為什么一些網(wǎng)站的聚合頁或站內(nèi)搜索頁被淪落為百度搜索打擊對象?
為什么說網(wǎng)站權(quán)重第一要素是網(wǎng)站結(jié)構(gòu)
移動網(wǎng)站SEO優(yōu)化策略和優(yōu)化要點(diǎn)
只需學(xué)會這幾招 就讓網(wǎng)站快速獲得排名
評論(0人參與,0條評論)
發(fā)布評論
最新評論