觸屏版
全國服務(wù)熱線:0571-87205688
登錄
注冊
客戶中心
關(guān)注云客
里約奧運(yùn)會(huì)結(jié)束了,資訊站點(diǎn)的小編們終于可以松口氣了,可有些SEOer卻高興不起來:編輯辛苦搶先制作的原創(chuàng)稿件,百度卻不!收!錄!院長奧運(yùn)會(huì)期間接到了四五起這樣的反饋,經(jīng)追查,原來是站點(diǎn)的搶發(fā)行為不夠友好,導(dǎo)致spider抓取失敗。結(jié)論:
1,頁面制作完成后再放到spider可以發(fā)現(xiàn)的地方,這樣才能達(dá)到最好的抓取效果。
2,頁面未對外公開之前,千萬不要通過工具推送給百度呀。
接到站長反饋后,院長聯(lián)系了spider工程師,工程師在后臺查詢了這些未收錄的鏈接,發(fā)現(xiàn)均顯示為“死鏈”,然而這些所謂的死鏈現(xiàn)在訪問都是好好的。根據(jù)后臺顯示的抓取時(shí)間,院長反復(fù)和站點(diǎn)進(jìn)行溝通,終于找到了根源:原來,站點(diǎn)為了搶新聞,提前制作了新聞稿并制作成鏈接并且發(fā)布,雖然沒有在首頁等重要頁面推送給用戶,但卻被BaiduSpider發(fā)現(xiàn),更重要的是,這些鏈接向BaiduSpider返回的狀態(tài)碼是404。
舉個(gè)例子,中國女排進(jìn)入決賽后,某網(wǎng)站做了A和B兩個(gè)頁面,分別為奪冠和摘銀,為了防止用戶在比賽結(jié)束之前閱讀到頁面內(nèi)容,站點(diǎn)將兩個(gè)鏈接都設(shè)置為404!404?。ǖ鹊奖荣惤Y(jié)束后,再將其中一個(gè)頁面的html返回碼改為200)。雖然頁面并沒有向用戶推送,但還是被聰明的BaiduSpider發(fā)現(xiàn)。然而這里的問題是,BaiduSpider發(fā)現(xiàn)頁面是404,又無法判斷出這是一個(gè)重要頁面,于是直接打入冷宮不再理睬。
所以,學(xué)院反復(fù)強(qiáng)調(diào),確認(rèn)頁面真的不需要被搜索引擎保留時(shí)可以使用404(臨時(shí)閉站可使用百度站長平臺的閉站保護(hù)工具),如果還希望和搜索引擎保持友好關(guān)系的話,請使用503,防止頁面被刪除。雖然Baidu有對高價(jià)值內(nèi)容的“刪除保護(hù)”功能,但畢竟不是每個(gè)站點(diǎn)都可以享受到這個(gè)特權(quán)的。
評論(0人參與,0條評論)
發(fā)布評論
最新評論