觸屏版
全國(guó)服務(wù)熱線:0571-87205688
登錄
注冊(cè)
客戶中心
關(guān)注云客
SEO搜索引擎基本工作原理:抓取、索引、排序
作為SEOer都應(yīng)該知道,SEO搜索引擎的工作原理過程是非常復(fù)雜的,但是,我們有必要認(rèn)識(shí)一下,基本工作原理,SEO搜索引擎基本工作原理大體分為三個(gè)階段: 抓取、索引、排序。有的教材上是:爬行和抓取、預(yù)處理、排名這三個(gè)階段,其實(shí)大致講的是一樣的。下面,就針對(duì)性的說一下:
SEO搜索引擎基本工作原理:
一、抓取
搜索引擎首先會(huì)派出一種被稱作“蜘蛛”或者是“機(jī)器人”的軟件,根據(jù)一定規(guī)則掃描存在于互聯(lián)網(wǎng)上的網(wǎng)站,并沿著網(wǎng)頁上的鏈接從一個(gè)網(wǎng)頁到另一個(gè)網(wǎng)頁,從一個(gè)網(wǎng)站到另一個(gè)網(wǎng)站,獲得頁面HTML代碼,并存入數(shù)據(jù)庫(kù)。為保證采集的資料最新,它還會(huì)回訪已抓取過的網(wǎng)頁。
SEO搜索引擎基本工作原理:抓取、索引、排序
二、索引
由分析索引系統(tǒng)程序?qū)κ占貋淼木W(wǎng)頁進(jìn)行分析,提取相關(guān)網(wǎng)頁信息(包括網(wǎng)頁所在URL、編碼類型、頁面內(nèi)容包含的所有關(guān)鍵詞、關(guān)鍵詞位置、生成時(shí)間、大小、與其它網(wǎng)頁的鏈接關(guān)系等),根據(jù)一定的相關(guān)度算法進(jìn)行大量復(fù)雜計(jì)算,得到每一個(gè)網(wǎng)頁針對(duì)頁面文字中及超鏈中每一個(gè)關(guān)鍵詞的相關(guān)度(或重要性),然后用這些相關(guān)信息建立網(wǎng)頁索引數(shù)據(jù)庫(kù)。
三、排序
當(dāng)用戶輸入關(guān)鍵詞搜索后,由搜索系統(tǒng)程序從網(wǎng)頁索引數(shù)據(jù)庫(kù)中找到符合該關(guān)鍵詞的所有相關(guān)網(wǎng)頁。因?yàn)樗邢嚓P(guān)網(wǎng)頁針對(duì)該關(guān)鍵詞的相關(guān)度早已算好,所以只需按照現(xiàn)成的相關(guān)度數(shù)值排序,相關(guān)度越高,排名越靠前。最后,由檢索器將搜索結(jié)果的鏈接地址和頁面內(nèi)容摘要等內(nèi)容組織起來,返回給用戶。
搜索引擎(SEO)的工作原理大體分為3步:爬行、抓取——索引——排序。
1.抓?。褐饕菙?shù)據(jù)收集。
2.索引/預(yù)處理:提取文字——中文分詞——去除停止詞——消除噪聲——去重——索引。
3.排序:搜索詞處理——匹配文件——初始子集選擇——相關(guān)性計(jì)算——過濾、調(diào)整——排名顯示。
以上便是SEO搜索引擎基本工作原理,很基礎(chǔ)的知識(shí),但掌握的人也不是很多,所以,我們有必要溫習(xí)一下,補(bǔ)補(bǔ)腦子。
評(píng)論(0人參與,0條評(píng)論)
發(fā)布評(píng)論
最新評(píng)論