觸屏版
全國服務(wù)熱線:0571-87205688
登錄
注冊(cè)
客戶中心
關(guān)注云客
在做網(wǎng)站結(jié)構(gòu)分析之前,要理解搜索引擎蜘蛛是擬人化的算法而已。算法就是按部就班的執(zhí)行事先設(shè)計(jì)的抓取策略,所以良好的網(wǎng)站結(jié)構(gòu)具備引導(dǎo)、分配權(quán)重、提高抓取效率等作用,只有內(nèi)部框架搭建好之后,內(nèi)容的布局才能井然有序,蜘蛛才能有序爬行。
網(wǎng)站結(jié)構(gòu)
事先應(yīng)該考慮到的問題:
蜘蛛是否實(shí)現(xiàn)邏輯上的全站抓取
蜘蛛是否可以區(qū)分頁面重要性
蜘蛛是否可以提取頁面的關(guān)鍵詞
一、邏輯上全站爬行
網(wǎng)站結(jié)構(gòu)優(yōu)化
網(wǎng)站物理結(jié)構(gòu),即基于內(nèi)容聚合的目錄及文件位置決定的結(jié)構(gòu)。目前的主流思維就是網(wǎng)站扁平化設(shè)計(jì),即平行結(jié)構(gòu)?!?/p>
鏈接結(jié)構(gòu)優(yōu)化
兩種蜘蛛抓取不到的頁面:網(wǎng)站本身不希望被收錄的頁面;沒有鏈接到達(dá)的頁面,即孤島頁面。對(duì)于沒有被首頁推薦的頁面,可以再內(nèi)鏈上補(bǔ)充。合理的內(nèi)鏈就是一個(gè)四通八達(dá)、井然有序的交通系統(tǒng),蜘蛛就是來往的車輛。社會(huì)化、描文本、設(shè)置鏈接入口等。
Domain結(jié)構(gòu)優(yōu)化
主要是二級(jí)域名和二級(jí)目錄的選擇策略。沒有絕對(duì)的好與不好,就科易網(wǎng)小編來說目前公司網(wǎng)站正在有二級(jí)域名網(wǎng)站結(jié)構(gòu)向二級(jí)目錄轉(zhuǎn)變,只是采取適應(yīng)當(dāng)前科易網(wǎng)發(fā)展的核心:塑造公司品牌。所以根據(jù)自身特點(diǎn)選擇合理的domain策略。
二、重要性的主導(dǎo)
對(duì)于搜索引擎來說,什么樣頁面會(huì)被認(rèn)為“更重要”?有這么一句話:每個(gè)鏈接都是一個(gè)投票,意思是:頁面的所有鏈接都是投票。在搜索引擎看來:獲得更多內(nèi)部投票的網(wǎng)頁相對(duì)來說更加重要。
三、網(wǎng)頁的標(biāo)簽:關(guān)鍵詞
搜索引擎在分析頁面的內(nèi)容是優(yōu)先從TDK入手,即title、description、keyword;之后就是H標(biāo)簽、alt標(biāo)簽;最后是TF-IDF ,即詞頻-文件頻率。從三個(gè)的關(guān)聯(lián)度定義頁面的“標(biāo)簽”,即抓取的時(shí)頁面的定義的關(guān)鍵詞。
評(píng)論(0人參與,0條評(píng)論)
發(fā)布評(píng)論
最新評(píng)論