網(wǎng)站收錄少的原因總結(jié)
【網(wǎng)站抓取量方面】
1、網(wǎng)站速度的影響
機(jī)房問題、dns問題、cdn加速問題、服務(wù)器帶寬、服務(wù)器硬件、操作系統(tǒng)、服務(wù)器軟件以及服務(wù)器所安裝的程序,這些都有可能影響我們網(wǎng)站的打開的速度。
2、安全軟件問題:比如開啟了防火墻規(guī)則、屏蔽了網(wǎng)站端口、開啟防采集規(guī)則、開啟防攻擊規(guī)則等,導(dǎo)致了搜索引擎同一時間由于大量訪問網(wǎng)站,而導(dǎo)致被安全軟件攔截。
3、網(wǎng)站硬盤問題:如在服務(wù)器里面安裝多個虛擬機(jī),導(dǎo)致硬盤轉(zhuǎn)速變慢,有時會導(dǎo)致搜索引擎打不開網(wǎng)站。
4、返回碼問題:比如同一個鏈接返回不同的返回碼,又或者404頁面返回200等。
5、url靜態(tài)化
URL靜態(tài)化的目的是有利于網(wǎng)站的排名,雖然現(xiàn)在搜索引擎已經(jīng)可以收錄動態(tài)地址,但是在在排名上靜態(tài)化的頁面比動態(tài)頁面更有優(yōu)勢, 并且URL靜態(tài)化將更有利于增加搜索引擎的信任度。但是,如果網(wǎng)站真的做不了靜態(tài)化的話,那就盡量使用短的url并且url中盡量少的使用動態(tài)參數(shù)。
6、url唯一性
網(wǎng)站中的同一個頁面,只對應(yīng)一個url地址;如果網(wǎng)站上多種url都能訪問到同樣的內(nèi)容的話,那么就會出現(xiàn)以下問題:
a、搜索引擎會選一種url為標(biāo)準(zhǔn),可能會和正版不同b、用戶可能為同一網(wǎng)頁的不同url做推薦,多種url形式分散了該網(wǎng)頁的權(quán)重
7、ulr帶關(guān)鍵詞
盡量在url中帶上網(wǎng)站的關(guān)鍵詞(拼音),這樣會在排名上面稍微的會占據(jù)一點因素,要知道百度是中文搜索引擎,對拼音的分析能力是很強(qiáng)大的。
8、代碼因素
網(wǎng)站的代碼要符合w3c的標(biāo)準(zhǔn),結(jié)構(gòu)層、表現(xiàn)層、行為層標(biāo)簽都應(yīng)該完整,建議使用開源程序。如:我的博客使用的wordpress程序。
9、head信息的正確性
網(wǎng)站的三大標(biāo)簽:標(biāo)題標(biāo)簽(title)、關(guān)鍵詞標(biāo)簽(keywords)、描述標(biāo)簽(description)
10、網(wǎng)站地圖
網(wǎng)站地圖是將網(wǎng)站的所有連接,最直觀的反應(yīng)給搜索引擎,可以提高搜素引擎的抓取效率,同時也為增加網(wǎng)站的收錄提供了良好的幫助。
11、推廣
網(wǎng)雜很難前期的推廣也非常重要,前期推廣包含QQ群推廣、QQ空間推廣、郵件推廣、軟文推廣、論壇外鏈推廣、平臺信息推廣。所有能引導(dǎo)來用戶點擊的推廣都可以,當(dāng)然一定要是良性的推廣。因為有點擊就會給予點擊權(quán)重,而網(wǎng)頁是具有一定權(quán)重以后才會被收錄。
12、外鏈問題:
我們發(fā)外鏈的目的有兩個,一個是吸引搜索引擎來抓取我們網(wǎng)站(引蜘蛛)另外一個就是提升網(wǎng)站的排名。
13、網(wǎng)站的結(jié)構(gòu)
網(wǎng)站結(jié)構(gòu)混亂,內(nèi)鏈系統(tǒng)雜亂無章也會導(dǎo)致收錄緩慢。比如不同欄目的內(nèi)容互相做鏈接,而有的內(nèi)容鏈接很多另一些內(nèi)頁鏈接很少。網(wǎng)站的層次也是一個原因,對于一般的企業(yè)站點三層已經(jīng)足夠放置所有的內(nèi)容,而如果層次太深會影響內(nèi)頁的收錄。
【內(nèi)容質(zhì)量方面】
1、內(nèi)容的原創(chuàng)性
前面有說到原創(chuàng)的內(nèi)容一定會被收錄,只不過是時間的問題而已,不論哪個搜素引擎,都是喜歡原創(chuàng)的內(nèi)容,網(wǎng)站內(nèi)容的原創(chuàng)性直接關(guān)系到搜索引擎對你網(wǎng)站的信任度,信任度又可以通過權(quán)重這個參考來反應(yīng)出來,所以,網(wǎng)站內(nèi)容的原創(chuàng)性是網(wǎng)站優(yōu)化的重中之重。
2、內(nèi)容的重復(fù)度
轉(zhuǎn)載、或者是采集的文章,頁面的文字、頁面都和之前頁面一樣,具有非常高的重復(fù)度,那么百度就會計算你和其他網(wǎng)站內(nèi)容的重復(fù)度,搜索引擎是一個喜新厭舊的家伙,如果每次你所發(fā)的內(nèi)容重復(fù)度都很高的話,那么漸漸地蜘蛛就會失去對你網(wǎng)站的興趣。
3、頁面的相似性
不僅僅要控制內(nèi)容的重復(fù)度,周邊的樣板文字部分也要保持保持一定的差異性,比如一些推薦欄目、推薦內(nèi)容等等,不用總是調(diào)用相同的內(nèi)容,最好根據(jù)文章內(nèi)容調(diào)用最相關(guān)的。
總的來說,就像前面的公式所示,我們盡力提高網(wǎng)站的抓取量,提升網(wǎng)站的內(nèi)容質(zhì)量,為互聯(lián)網(wǎng)創(chuàng)造有價值內(nèi)容,這樣就會很大程度提升我們網(wǎng)站的收錄量以及收錄率。