觸屏版
全國(guó)服務(wù)熱線:0571-87205688
登錄
注冊(cè)
客戶中心
關(guān)注云客
自從百度站長(zhǎng)平臺(tái)"抓取診斷"工具上線以來(lái),很多站長(zhǎng)朋友都把此工具當(dāng)做引蜘蛛的手段,可是筆者親測(cè)了下,發(fā)現(xiàn)"抓取診斷"工具存在各種各樣的問(wèn)題,所以 我們不能過(guò)于依賴,而應(yīng)選擇性的應(yīng)用.下面我們就來(lái)探討下百度"抓取診斷"工具具體有什么作用以及需要改進(jìn)的地方.
首先我們來(lái)看看百度官方的解釋:
一、什么是抓取工具?
1)抓取診斷工具,可以讓站長(zhǎng)從百度蜘蛛的視角查看抓取內(nèi)容,自助診斷百度蜘蛛看到的內(nèi)容,和預(yù)期是否一致.
2)每個(gè)站點(diǎn)每月可使用300次,抓取結(jié)果只展現(xiàn)百度蜘蛛可見(jiàn)的前200KB內(nèi)容.
二、抓取診斷工具能做什么?
1)診斷抓取內(nèi)容是否符合預(yù)期,譬如很多商品詳情頁(yè)面,價(jià)格信息是通過(guò)JavaScript輸出的,對(duì)百度蜘蛛不友好,價(jià)格信息較難在搜索中應(yīng)用.問(wèn)題修正后,可用診斷工具再次抓取檢驗(yàn).
2)診斷網(wǎng)頁(yè)是否被加了黒鏈、隱藏文本.網(wǎng)站如果被黑,可能被加上隱藏的鏈接,這些鏈可能只在百度抓取時(shí)才出現(xiàn),需要用此抓取工具診斷.
3)檢查網(wǎng)站與百度的連接是否暢通,若是IP信息不一致,可以報(bào)錯(cuò)通知百度更新IP.
4)如果網(wǎng)站有新頁(yè)面或頁(yè)面內(nèi)容有更新,百度蜘蛛較長(zhǎng)時(shí)間沒(méi)來(lái)訪問(wèn),可以通過(guò)此工具邀請(qǐng)它快速來(lái)抓取.
筆者測(cè)試了一下,有些網(wǎng)站可以抓取成功,如下圖所示,這里面包含了很多信息,同時(shí)還能很好的顯示網(wǎng)頁(yè)的源代碼,可以為站長(zhǎng)提供一定的幫助.
可是對(duì)于雙線主機(jī)和做了別名解析的非固定IP主機(jī),總是出現(xiàn)抓取失敗或者抓取中的現(xiàn)象,偶爾也能抓取成功,如圖所示:
這是否意味著,百度百度蜘蛛無(wú)法抓取到我們的網(wǎng)頁(yè)呢?答案是否定的,筆者剛測(cè)試的這個(gè)抓取失敗的網(wǎng)站,當(dāng)天所發(fā)文章全部都是秒收,證明百度蜘蛛能很好的抓取網(wǎng)頁(yè),單身"抓取診斷"工具卻出差,這說(shuō)明這項(xiàng)技術(shù)還不成熟,所以我們只能參考,不能過(guò)于依賴.
還有一點(diǎn)需要注意的是,抓取同一個(gè)頁(yè)面以后,百度會(huì)有很長(zhǎng)時(shí)間的緩存,如下圖所示.筆者上午11點(diǎn)09分抓取了一個(gè)頁(yè)面,并在頁(yè)面里掛上"黑鏈","抓取 工具"抓到的源代碼里有這些"黑鏈"代碼,可是筆者把這些"黑鏈"全都去了以后,晚上19點(diǎn)13分又抓取了一次,發(fā)現(xiàn)抓取到的頁(yè)面還是上午11點(diǎn)09分抓 的頁(yè)面,中間相隔了8個(gè)小時(shí).
除此以外,抓取工具對(duì)于網(wǎng)站IP地址的判定經(jīng)常會(huì)出錯(cuò),一旦IP地址判定錯(cuò)誤,就會(huì)出現(xiàn)抓取失敗的現(xiàn)象.但是這并不代表蜘蛛不能訪問(wèn)我們的網(wǎng)站,其實(shí)蜘蛛是蜘蛛,抓取工具是一種工具,大家千萬(wàn)不要混為一談.
當(dāng)然了,任何工具的新上線,都存在這樣那樣的問(wèn)題,我們只要選擇對(duì)我們有利的地方去應(yīng)用就行了,而不應(yīng)過(guò)于依賴所有的功能.同時(shí)也希望度娘能盡快加以改 進(jìn),把有問(wèn)題的地方都處理好,給廣大站長(zhǎng)朋友一個(gè)有用的工具.
本文由安徽美食網(wǎng)( )撰寫(xiě),轉(zhuǎn)載請(qǐng)注明出處.
seoer需要具備的基本能力:良好的溝通能力
總結(jié)SEO學(xué)習(xí)者成長(zhǎng)的三個(gè)階段
實(shí)例分析搜索引擎大版正式步入微時(shí)代
網(wǎng)絡(luò)營(yíng)銷:人們常無(wú)意識(shí)犯下的7大SEO致命錯(cuò)誤
分析眾多新手站長(zhǎng)面對(duì)的困惑
新手站長(zhǎng)如何獲得有效的高質(zhì)量外鏈
如何優(yōu)化Dedecms及要修改模板哪些方面
SEOer擠出點(diǎn)滴時(shí)間堅(jiān)持每天必做哪些工作
如何寫(xiě)出一篇可以轉(zhuǎn)載上萬(wàn)次的文章
產(chǎn)品頁(yè)進(jìn)行SEO優(yōu)化的七個(gè)步驟
評(píng)論(0人參與,0條評(píng)論)
發(fā)布評(píng)論
最新評(píng)論