觸屏版
全國服務(wù)熱線:0571-87205688
登錄
注冊
客戶中心
關(guān)注云客
百度不收錄網(wǎng)站的原因我大致分為內(nèi)容問題、結(jié)構(gòu)設(shè)計問題以及其他問題。網(wǎng)站不被收錄,我們就無法將網(wǎng)站的信息更好的傳達給我們的目標受眾;下面我將圍繞前面提到的三個問題闡述下百度不收錄的原因,并糾正一些其他的個人認為概念上的錯誤問題:
1.新站處于百度考核期
看到有些人表達的觀點是新站處于百度考核期可能會不被收錄,我對這種觀點表示不贊成,只要是新站,新域名,在結(jié)構(gòu)以及內(nèi)容上面如果不是高度重復(fù)的話,一般都會被收錄,至于所說的百度考核期,我們表示不認同。百度考核期應(yīng)該是在網(wǎng)站首頁被收錄后,不收錄其他頁面時該考慮的問題。
2.您網(wǎng)站的robots協(xié)議禁止百度抓取
每個網(wǎng)站都有一個robots.txt,搜索引擎來的網(wǎng)站的時候,會先查看這個文件,百度蜘蛛與google機器人不同之處也在于此,當(dāng)google機器人去爬網(wǎng)站,發(fā)現(xiàn)robots設(shè)置了禁止蜘蛛的抓取時,蜘蛛就會退出,不抓取任何網(wǎng)站內(nèi)容;而百度對設(shè)置robots的生效時間不是即使的,所以當(dāng)您設(shè)置好robots時,可能您的網(wǎng)站已經(jīng)被百度收錄(可能由于您提交至搜索引擎或者是發(fā)布過導(dǎo)入鏈接),所以robots協(xié)議禁止百度抓取而導(dǎo)致不收錄的幾率是非常的小。
3.網(wǎng)站內(nèi)容有敏感語言
百度被央視曝光了以后,對抓取內(nèi)容可能會更加規(guī)范。對于一些帶有敏感性話題的內(nèi)容,會不進行抓取,這個也是造成不收錄。雖說個人站長可能在發(fā)布文章時不會帶此言語,但是我們不能確定給我們留言評論的內(nèi)容是否帶有這些敏感內(nèi)容,我們不能確定網(wǎng)站是否被入侵,在網(wǎng)站內(nèi)部生成了一些敏感性的頁面內(nèi)容。所以,在留言評論方面,我們要做好嚴格的審核機制,要定期做網(wǎng)站內(nèi)部文件進行整理。
4.其他問題
目前遇到一種情況就是后綴名為.cn.com的域名在百度暫時不被收錄,而在google收錄良好,具體原因還不清楚。
5.網(wǎng)站是復(fù)制自互聯(lián)網(wǎng)上的高度重復(fù)性的內(nèi)容
當(dāng)然,不僅是百度,其他搜索引擎一樣反對高度重復(fù)性內(nèi)容,所以,要想運營網(wǎng)站,內(nèi)容也是必要的保證,完全靠復(fù)制內(nèi)容的網(wǎng)站是無法再搜索引擎生存的。
6.網(wǎng)站在設(shè)計或者結(jié)構(gòu)上存在缺陷,導(dǎo)致蜘蛛無法正常抓取
很多網(wǎng)頁設(shè)計公司的程序員并不懂SEO,他們會將網(wǎng)站設(shè)計得很精美,也許是全站FLASH,也許是網(wǎng)站框架結(jié)構(gòu)(iframe),也許網(wǎng)站是由javascript或者ajax拼裝起來的,也許是圖片太多,文本太少,這些百度蜘蛛爬起來是非常的費勁,甚至直接不抓取,百度SEO指南已證實了這一點。
7.網(wǎng)站不被百度收錄且都不符合以上內(nèi)容,那么,我們需要查看網(wǎng)站日志進一步了解原因
如果百度蜘蛛抓取網(wǎng)頁返回的是200 0 0代碼,則表示該網(wǎng)頁已經(jīng)成功編進索引;若返回的是200 0 64則表示該索引數(shù)據(jù)庫已經(jīng)存在,沒有發(fā)現(xiàn)網(wǎng)頁有更新的內(nèi)容,不需要重新索引。
假如沒有蜘蛛來爬行抓取過,那我們就再提交一次網(wǎng)址,并保持網(wǎng)站內(nèi)容的定期更新(純原創(chuàng)或者高度偽原創(chuàng)),同時增加外鏈(包括友鏈、簽名鏈等高質(zhì)量的外部鏈接)相信不久的幾天,您的網(wǎng)站即將被收錄。
評論(0人參與,0條評論)
發(fā)布評論
最新評論