觸屏版
全國服務(wù)熱線:0571-87205688
登錄
注冊(cè)
客戶中心
關(guān)注云客
一、站點(diǎn)結(jié)構(gòu)
1、邏輯清晰的鏈接層次結(jié)構(gòu)
A、以首頁為根節(jié)點(diǎn)的樹狀連通圖
B、避免過于扁平化的結(jié)構(gòu)
C、避免孤島鏈接
首頁-頻道-索引-內(nèi)容頁
注意: 不利于spider抓取的情況
1、通過query(搜索)檢索得到的內(nèi)頁。
2、需要相應(yīng)設(shè)置才能訪問內(nèi)頁的情況
………………………………………………
2、PC/移動(dòng)適配
1)建立適配:PC與移動(dòng)端URL,有規(guī)則級(jí)的對(duì)應(yīng)關(guān)系,且相互關(guān)聯(lián)
2)不建議做法
A、單一域名下多種配置方式
B、把移動(dòng)站作為PC下一級(jí)目錄,如: 3w。a.com/m/
3、數(shù)據(jù)主動(dòng)提交
新產(chǎn)出鏈接與發(fā)生變化的資源鏈接應(yīng)及時(shí)提交(避免死鏈)
4、避免目錄被黑或售賣
二、頁面結(jié)構(gòu)
1、不建議使用js加載頁面內(nèi)容
1)內(nèi)容放置js中,影響索引
2)鏈接和錨文本的鏈接
注: 1)索引頁js渲染點(diǎn)擊事件才發(fā)生鏈接
2)顯示一部分,點(diǎn)擊加載全文/下拉
2、移動(dòng)友好性標(biāo)準(zhǔn)
3、索引頁友好性
1)排版布局:
A、按發(fā)布時(shí)間順序、忌時(shí)間錯(cuò)亂(置頂內(nèi)容可模塊化處理)
B、不要漏鏈(孤島)
2)內(nèi)容質(zhì)量
A、只包括同主題內(nèi)容頁
B、保持與內(nèi)容同步更新
C、避免交叉泛濫索引頁
4、索引頁翻頁友好性(PC端)
1)1 2 3 順序排序
如果可能,盡量列舉全部翻頁,至少保留最近一段時(shí)間的所有內(nèi)容
2)不友好做法
A、僅有上一頁、下一頁
B、URL以頁數(shù)控制,不要用URL起始數(shù)量
C、翻頁后鏈URL與翻頁頁碼關(guān)聯(lián)
5、索引頁翻頁友好性(移動(dòng)端)
A、采用PC端翻頁建議
B、采用下拉動(dòng)作觸發(fā)加載,下拉次數(shù)上限為3次
C、針對(duì)百度UA特殊處理,返回更完整的翻頁內(nèi)容
注意: 不友好做法
無限下拉、點(diǎn)擊加載更多
三、抓取限制
1、避免預(yù)期以外的封禁
1)UA/IP封禁
A、建站模板中包含的封禁信息,被遷移
B、服務(wù)器自動(dòng)封禁策略
C、網(wǎng)站所在空間服務(wù)商封禁IP
2、建議
服務(wù)器設(shè)置排查,確保robots、UA、IP設(shè)置是否符合預(yù)期
3、死鏈接反饋
對(duì)于百度蜘蛛的抓取,返回404等明確狀態(tài)碼
………………………………………………
深度解讀百度抓取提升神器-鏈接提交
高級(jí)工程師 劉立
1、主動(dòng)提交(實(shí)時(shí)提交)原理
傳統(tǒng): 網(wǎng)站發(fā)布新頁面-等待百度爬蟲逐層遍歷發(fā)現(xiàn)-百度爬蟲發(fā)現(xiàn)網(wǎng)頁
實(shí)時(shí): 網(wǎng)站發(fā)布新頁面-百度爬蟲發(fā)現(xiàn)網(wǎng)頁
2、大量提交垃圾和重復(fù)頁面的站點(diǎn),限制提交或關(guān)閉
評(píng)論(0人參與,0條評(píng)論)
發(fā)布評(píng)論
最新評(píng)論