觸屏版
全國服務(wù)熱線:0571-87205688
登錄
注冊
客戶中心
關(guān)注云客
抓取份額是搜索引擎蜘蛛花在一個網(wǎng)站上的抓取頁面的總的時間上限.對于特定網(wǎng)站,搜索引擎蜘蛛花在這個網(wǎng)站上的總時間是相對固定的,不會無限制地抓取網(wǎng)站所有頁面.
抓取份額的英文Google用的是crawl budget,直譯是爬行預(yù)算,我覺得不太能說明是什么意思,所以用抓取份額表達這個概念.
決定抓取需求的主要有兩個因素.一是頁面權(quán)重,網(wǎng)站上有多少頁面達到了基本頁面權(quán)重,搜索引擎就想抓取多少頁面.二是索引庫里頁面是否太久沒更新了.說到底還是頁面權(quán)重,權(quán)重高的頁面就不會太久不更新.
頁面權(quán)重和網(wǎng)站權(quán)重又是息息相關(guān)的,提高網(wǎng)站權(quán)重,就能使搜索引擎愿意多抓取頁面.
搜索引擎蜘蛛不會為了抓取更多頁面,把人家網(wǎng)站服務(wù)器拖垮,所以對某個網(wǎng)站都會設(shè)定一個抓取速度的上限,crawl rate limit,也就是服務(wù)器能承受的上限,在這個速度限制內(nèi),蜘蛛抓取不會拖慢服務(wù)器、影響用戶訪問.
服務(wù)器反應(yīng)速度夠快,這個速度限制就上調(diào)一點,抓取加快,服務(wù)器反應(yīng)速度下降,速度限制跟著下降,抓取減慢,甚至停止抓取.
所以,抓取速度限制是搜索引擎"能"抓取的頁面數(shù).
小網(wǎng)站頁面數(shù)少,即使網(wǎng)站權(quán)重再低,服務(wù)器再慢,每天搜索引擎蜘蛛抓取的再少,通常至少也能抓個幾百頁,十幾天怎么也全站抓取一遍了,所以幾千個頁面的網(wǎng)站根本不用擔(dān)心抓取份額的事.數(shù)萬個頁面的網(wǎng)站一般也不是什么大事.每天幾百個訪問要是能拖慢服務(wù)器,SEO就不是主要需要考慮的事了.
抓取份額不夠,比如網(wǎng)站有1千萬頁面,搜索引擎每天只能抓幾萬個頁面,那么把網(wǎng)站抓一遍可能需要幾個月,甚至一年,也可能意味著一些重要頁面沒辦法被抓取,所以也就沒排名,或者重要頁面不能及時被更新.
要想網(wǎng)站頁面被及時、充分抓取,首先要保證服務(wù)器夠快,頁面夠小.如果網(wǎng)站有海量高質(zhì)量數(shù)據(jù),抓取份額將受限于抓取速度,提高頁面速度直接提高抓取速度限制,因而提高抓取份額.
抓取速度和抓取份額不是排名因素.但沒被抓取的頁面也談不上排名.
評論(0人參與,0條評論)
發(fā)布評論
最新評論