上述優(yōu)質(zhì)網(wǎng)頁進了索引庫,那其實互聯(lián)網(wǎng)上大部分網(wǎng)站根本沒有被百度收錄。并非是百度沒有發(fā)現(xiàn)他們,而是在建庫前的篩選環(huán)節(jié)被過濾掉了。那怎樣的網(wǎng)頁在最初環(huán)節(jié)就被過濾掉了呢:
1, 重復內(nèi)容的網(wǎng)頁:互聯(lián)網(wǎng)上已有的內(nèi)容,百度必然沒有必要再收錄。
2, 主體內(nèi)容空短的網(wǎng)頁
1)有些內(nèi)容使用了百度spider無法解析的技術,如JS、AJAX等,雖然用戶訪問能看到豐富的內(nèi)容,依然會被搜索引擎拋棄
2)加載速度過慢的網(wǎng)頁,也有可能被當作空短頁面處理,注意廣告加載時間算在網(wǎng)頁整體加載時間內(nèi)。
3)很多主體不突出的網(wǎng)頁即使被抓取回來也會在這個環(huán)節(jié)被拋棄。
3, 部分作弊網(wǎng)頁
評論(0人參與,0條評論)
發(fā)布評論
最新評論