觸屏版
全國服務(wù)熱線:0571-87205688
登錄
注冊
客戶中心
關(guān)注云客
作為一個合格的SEO優(yōu)化人員,想讓我們的網(wǎng)站更加符合搜索引擎的規(guī)范,就必須了解搜索引擎是如何工作的,這也是每一個SEO優(yōu)化人員的基本功,下面我們就來詳細(xì)解釋一下搜索引擎是如何工作的。
一、抓取
這個步驟就像大海里撈魚,搜索引擎像一個大魚網(wǎng)通過抓取的方式不斷獲得我們網(wǎng)站的各個元素。
1.抓取程序(蜘蛛)
既然抓取就需要工具,搜索引擎抓取頁面的工具被我們俗稱為蜘蛛,他是一個搜索引擎開發(fā)的軟件系統(tǒng),搜索引擎通過這些抓取程序每天不間斷的對我們的網(wǎng)站進(jìn)行抓取,為了區(qū)分開來,不同的搜索引擎他的抓取程序的名字是不一樣的。
百度蜘蛛:BaiduSpider 谷歌機(jī)器人:Googlebot 360蜘蛛:360Spider
這是幾個大的搜索引擎的蜘蛛的名字,其他搜索引擎抓取程序的名字自己查詢一下即可。
2.如何讓抓取程序來抓取
我們肯定希望我們的網(wǎng)站都能夠被搜索引擎盡快的抓取,首先搜索引擎的抓取程序是通過鏈接對我們的網(wǎng)站進(jìn)行抓取的,我們網(wǎng)站一般都是通過做外部鏈接的方式來讓蜘蛛更好的抓取我們的網(wǎng)站,蜘蛛通過鏈接爬取到我們的頁面的時候他還會通過該頁面上面的鏈接進(jìn)行繼續(xù)爬取。
我們還可以通過提交鏈接的方式來讓蜘蛛抓取我們的頁面,各大搜索引擎都提供了提交入口,我們想讓蜘蛛抓取我們的哪個頁面我們?nèi)ヌ峤患纯?。?dāng)然還有的網(wǎng)站蜘蛛主動上門來抓取的,互聯(lián)網(wǎng)上的高質(zhì)量的內(nèi)容是非常稀缺的,當(dāng)你的網(wǎng)站有高質(zhì)量的內(nèi)容的時候,蜘蛛就會主動上門并且定期的來抓取你網(wǎng)站的內(nèi)容,以更新他自己的數(shù)據(jù)庫。
3.怎么知道蜘蛛是否抓取了我們的網(wǎng)站
有兩種方式能夠看到蜘蛛是否抓取了我們的網(wǎng)站
第一、百度站長平臺的抓取頻率
推薦大家加入百度站長平臺,里面的很多功能對SEO優(yōu)化都有很大的幫助
第二、服務(wù)器日志
服務(wù)器日志更能夠直觀的反映出蜘蛛對于我們網(wǎng)站哪個頁面在什么時間通過什么方式抓取的,我們需要會看服務(wù)器日志,當(dāng)然我們也可以通過日志分析工具進(jìn)行分析。
4.影響蜘蛛抓取頁面的因素
我們知道了蜘蛛通過什么方式抓取我們的頁面也知道了怎么看蜘蛛的抓取軌跡,那么什么因素能夠影響蜘蛛的抓取呢,主要因素有兩個,路徑過長和中文路徑。
A.路徑過長
過長的路徑會影響蜘蛛對于這個鏈接所在的頁面的抓取,所以我們在設(shè)置路徑的時候盡量簡潔明了,動態(tài)路徑的話要做好偽靜態(tài),盡量避免不必要的參數(shù)出現(xiàn)在路徑里。
B.中文路徑
很多網(wǎng)站的程序會生成一些中文的路徑,他們覺得這樣會很利于用戶對于該路徑下的內(nèi)容的了解,但是中文路徑對于蜘蛛的爬取影響是非常大的,所以我們要避免中文路徑。
二、過濾
1.為什么過濾
搜素引擎通過撈魚的方式抓取來的頁面是魚龍混雜的,我們知道在互聯(lián)網(wǎng)上會充斥著各種無價值的頁面、死鏈接頁面、欺騙頁面等等,搜索引擎為了節(jié)省抓取程序的服務(wù)器資源同時為了節(jié)省搜索引擎的工作時間,要對所抓取的頁面進(jìn)行過濾。
2.影響過濾的因素
首先搜索引擎對于JS代碼、FLASH、iframe框架都是無法識別的,所以在關(guān)鍵內(nèi)容我們要盡量不用或者少用這三個因素,其次是圖片對于圖片我們要做好ALT標(biāo)簽,因為他是通過ALT標(biāo)簽對圖片進(jìn)行識別的。
其次頁面質(zhì)量對于搜索引擎的過濾也是很有影響的,我們應(yīng)該盡量提高自己的頁面質(zhì)量也便保證搜索引擎不把我們的頁面過濾掉。
三、收錄
在我們的網(wǎng)站頁面經(jīng)過了前兩部的抓取和過濾之后,搜索引擎就會把我們的頁面納入到他的索引庫里面,這就是我們經(jīng)常說的收錄,也就是具體呈現(xiàn)到我們面前的一個個頁面。
我們可以通過SITE加域名還有百度站長平臺的索引量查詢這兩個方式來查看我們的收錄量或者索引量。
四、排序
當(dāng)搜索引擎對我們的頁面建立了索引并且納入他的數(shù)據(jù)庫之后,搜索引擎會根據(jù)自身的一個算法機(jī)制對于這些頁面進(jìn)行一個排序,我們每一個SEO不斷研究的也正是如何能夠讓自己的網(wǎng)站獲得更好的排序,擁有一個好的排名是綜合因素的結(jié)果,我們需要做好每一個細(xì)節(jié)。
總結(jié)
我們詳解介紹了搜索引擎工作的四個步驟,包括抓取、過濾、收錄還有排序,這四個步驟每一步都非常的重要他們之間的聯(lián)系也是非常的緊密的,只有我們對每一步進(jìn)行詳細(xì)了解并且把我們網(wǎng)站按照搜索引擎的規(guī)則做好,最后我們才可能獲得搜索引擎的親睞。
評論(0人參與,0條評論)
發(fā)布評論
最新評論