觸屏版
全國服務(wù)熱線:0571-87205688
登錄
注冊(cè)
客戶中心
關(guān)注云客
搜索引擎的工作過程的三個(gè)階段
第一、爬行和抓取網(wǎng)頁。
搜索引擎蜘蛛通過連接,訪問到網(wǎng)頁,抓取網(wǎng)頁HTML代碼,發(fā)送到數(shù)據(jù)庫儲(chǔ)存起來,等待下一步程序。常見的搜索引擎蜘蛛有:百度蜘蛛(Baiduspider )谷歌蜘蛛(Googlebot),soso蜘蛛(Sosospider ),雅虎蜘蛛(Yahoo!Slurp),微軟Bing蜘蛛(msnbot)搜狗蜘蛛(Sogou web robot )。蜘蛛根據(jù)鏈接爬行網(wǎng)站有兩種策略:一是深度優(yōu)先,一是廣度優(yōu)先。
第二、分析網(wǎng)頁。
分析網(wǎng)頁就是我們通常所說的預(yù)處理。這步程序蜘蛛會(huì)把抓取回來的HTML代碼,進(jìn)行文字提取、去停止詞、消噪音、去重,然后對(duì)這些文字進(jìn)行分詞、索引等處理,以備排名程序使用。這些過程都是非常復(fù)雜的,我們只需要了解它們是怎么分詞,怎么索引就行了。如果有興趣進(jìn)一步研究的話,可以在網(wǎng)上找一些搜索引擎原理的資料或者購買介紹搜索引擎原理的書看。
第三、排名。
排名是搜索引擎程序的最后一步程序了。當(dāng)搜索引擎把網(wǎng)頁進(jìn)行一系列的分析過后,就把數(shù)據(jù)傳送到排名程序,當(dāng)用戶搜索某個(gè)關(guān)鍵詞時(shí)候,排名程序就會(huì)調(diào)用經(jīng)過分析網(wǎng)頁,檢索處理的數(shù)據(jù)庫數(shù)據(jù),對(duì)關(guān)鍵詞進(jìn)行匹配、計(jì)算相關(guān)性,然后生成排名頁面反饋給用戶。當(dāng)然影響排名的因素還有網(wǎng)站的結(jié)構(gòu)優(yōu)化,內(nèi)鏈優(yōu)化,外鏈質(zhì)量和數(shù)量等,包括地域性的因素。
以上三步是搜索引擎工作的基本原理,每一步程序都非常的復(fù)雜,我們只要大致了解一下,不需要進(jìn)行深入的研究,最終影響排名的因素有很多很多,我們無法全部知道和掌握,只有在不斷的實(shí)踐過程中,主意細(xì)節(jié),記錄和分析數(shù)據(jù),才能更了解搜索引擎,才能進(jìn)一步的提高自己網(wǎng)站的排名,獲得流量和知名度。
評(píng)論(0人參與,0條評(píng)論)
發(fā)布評(píng)論
最新評(píng)論