從搜索引擎蜘蛛的考核標準提高SEO優(yōu)化技巧
做SEO優(yōu)化的都希望網(wǎng)站對搜索引擎蜘蛛友好,希望蜘蛛能在自己的網(wǎng)站多待會多抓取點網(wǎng)頁??墒悄銈?/span>可曾想過,蜘蛛又何嘗不想多抓取點頁面,多更新點頁面呢,無奈于互聯(lián)網(wǎng)信息龐大,有時候蜘蛛實在是力不能及。其實蜘蛛每天也是像我們這些優(yōu)化人員一樣干著苦逼的活,它們也是需要考核評價的。那么蜘蛛在日常抓取中有哪些考核的標準呢?從考核標準的三個方面分析我們SEO優(yōu)化技巧。
一、抓取網(wǎng)頁覆蓋率
目前搜索引擎蜘蛛按照常規(guī)方式很難抓取到的互聯(lián)網(wǎng)頁面,蜘蛛是依賴頁面中的鏈接發(fā)現(xiàn)新的頁面,進而抓取索引,但是很多頁面內(nèi)容是以數(shù)據(jù)庫方式存儲的。這樣蜘蛛很難或無法抓取這些信息,結(jié)果就是用戶也無法在搜索引擎搜索得到搜。所以搜索引擎不能能抓取互聯(lián)網(wǎng)上出現(xiàn)的所有網(wǎng)頁,所有搜索引擎只能索引互聯(lián)網(wǎng)的一部分而已。
抓取網(wǎng)頁覆蓋率指的是蜘蛛抓取的網(wǎng)頁數(shù)量占互聯(lián)網(wǎng)所有網(wǎng)頁數(shù)量的比例,很明顯,這個覆蓋率越高,搜索引擎所能索引排名的數(shù)量級也就越大,能夠參與比較展現(xiàn)的搜索結(jié)果也就越多,用戶搜索體驗也越好。所以為了讓用戶在搜索時可以得到更精準、更全面的結(jié)果,抓取網(wǎng)頁覆蓋率至關(guān)重要,而除了抓取方式的提高,對暗網(wǎng)數(shù)據(jù)的抓取已成為各大搜索引擎的重要研究方向。
二、抓取網(wǎng)頁的重要性
蜘蛛抓取了很多內(nèi)容,也及時更新了,但如果抓取的都是一些低質(zhì)量內(nèi)容,那肯定是不行的。盡管要多抓勤抓,但是每個網(wǎng)頁重要性差異很大,這就是矛盾的地方,搜索引擎蜘蛛不僅要干得多、干得快、還要干得好。所以必然會優(yōu)先照顧部分能經(jīng)常更新高質(zhì)量內(nèi)容的網(wǎng)站,特別是定時定量更新的,這樣才能最大程度上保證優(yōu)質(zhì)內(nèi)容不被漏掉。如果搜索引擎蜘蛛抓回的網(wǎng)頁大都是比較重要的網(wǎng)頁,則可說其在抓取網(wǎng)頁重要性方面做得很好。
三、抓取網(wǎng)頁時效性
對于用戶的搜索體驗,網(wǎng)頁的時效性相對覆蓋率句更加直觀了,比如你在搜索結(jié)果搜索到了一個結(jié)果,當你點擊后頁面是不存在的,這時對這個網(wǎng)站的信任度直線下降。搜索引擎是在努力避免這些的,所以蜘蛛抓取網(wǎng)頁時效性同樣是一個重要考核點?;ヂ?lián)網(wǎng)信息比較多,蜘蛛抓取一輪需要較長的時間周期,這個時間內(nèi)之前建立索引的很多網(wǎng)頁可能已經(jīng)發(fā)生變化或者被刪除,這就導致搜索結(jié)果中有一部分是過期的數(shù)據(jù)。
蜘蛛不能在網(wǎng)頁變化后第一時間將這些變化反映到網(wǎng)頁庫中,這樣問題就來了,首先比如頁面只是內(nèi)容發(fā)生變化,搜索引擎不能及時的去重新比較這些變化,給予用戶更合理的排名。其次,如果排在搜索結(jié)果前面的頁面已經(jīng)被刪除了,由于沒有及時抓取更新,還排在重要位置,那么無疑對用戶是一種傷害。最后,很多人會在頁面收錄后另外加一些不好的信息,這樣用之前的排名展現(xiàn)現(xiàn)在的信息,下次蜘蛛更新才會處理。
所以對于搜索引擎而言,最希望數(shù)據(jù)庫內(nèi)網(wǎng)頁能及時更新的,網(wǎng)頁庫過期的數(shù)據(jù)越少,則網(wǎng)頁的時效性越好,這對用戶體驗的作用不言而喻。
總而言之,目前的搜索引擎蜘蛛由于種種原因限制,只能抓取互聯(lián)網(wǎng)部分網(wǎng)頁的,所以在努力抓取盡可能多頁面的同時會盡可能選擇比較重要的那部分頁面來索引,而對于己經(jīng)抓取到的網(wǎng)頁,也會盡可能快地更新其內(nèi)容。注意所有的這些都是盡可能而已,所以這是各大搜索引擎努力的方向。如果這3個方面都做得好,搜索引擎用戶體驗肯定會更好。