觸屏版
全國服務(wù)熱線:0571-87205688
登錄
注冊
客戶中心
關(guān)注云客
SEO簡稱為搜索引擎優(yōu)化。其主要工作是通過了解各類搜索引擎如何抓取互聯(lián)網(wǎng)頁面、如何進(jìn)行索引以及如何確定其對某一特定關(guān)鍵詞的搜索結(jié)果排名等技術(shù),來對網(wǎng)頁進(jìn)行相關(guān)的優(yōu)化,使其提高搜索引擎排名,從而提高網(wǎng)站訪問量,最終提升網(wǎng)站的銷售能力或宣傳能力的技術(shù)。
在國外,SEO開展較早,那些專門從事SEO的技術(shù)人員被Google稱之為searchengineoptimizers(SEOers)。由于Google是目前最大的搜索引擎提供商,Google也成為了全世界SEOers的主要研究對像。為此Google官方網(wǎng)站專門有一頁介紹SEO,并表明 Google對SEO的態(tài)度。
SEO的出現(xiàn)最早是研究搜索同HACK找尋漏洞的技術(shù)發(fā)展中引渡過來的,一部分人發(fā)現(xiàn)了這個可以左右搜索排名的機制問題,而在世界頂級搜索引擎Google的飛速發(fā)展及排名算法機制不斷更新的情況下,SEO技術(shù)及隊伍也在近些年來飛速發(fā)展和壯大,人們對它的認(rèn)可和重視也與日俱增。
一、SEO作弊
1、什么是seo作弊
搜索引擎作弊,或稱為SEO作弊、SEOSpam、搜索引擎垃圾等,是指為了提高在搜索引擎中展現(xiàn)機會和排名的目的,欺騙搜索引擎的行為。
2、如何作弊
由于技術(shù)型搜索引擎在網(wǎng)站排名過程中完全由蜘蛛程序自動完成,沒有人工參與,這為那些針對排名原理而采用欺騙蜘蛛程序的手段提供了成功的可能性。在SEO的發(fā)展過程中,一直伴隨著關(guān)于作弊方法的討論,成為業(yè)界關(guān)注的話題。成為SEO必須了解基本的作弊手段,目的是避免無意間采用了相關(guān)手段遭到處罰。以下是被視為作弊的常見手段
a)、關(guān)鍵字堆砌。為了增加關(guān)鍵詞的出現(xiàn)頻次,故意在網(wǎng)頁代碼中,如在META、title、注釋、圖片ALT以及URL地址等地方重復(fù)書寫某關(guān)鍵詞的行為(stuffing)。
b)、虛假關(guān)鍵詞。通過在META中設(shè)置與網(wǎng)站內(nèi)容無關(guān)的關(guān)鍵詞,如在title中設(shè)置熱門關(guān)鍵詞,以達(dá)到誤導(dǎo)用戶進(jìn)人網(wǎng)站的目的。同樣的情況也包括鏈接關(guān)鍵詞與實際內(nèi)容不符的情況。
c)、隱形文本/鏈接。為了增加關(guān)鍵詞的出現(xiàn)頻次,故意在網(wǎng)頁中放一段與背景顏色相同的、包含密集關(guān)鍵字的文本。訪客看不到,搜索弓I擎卻能找到。類似方法還包括超小號文字、文字隱藏層等手段。隱藏鏈接是在隱形文本的基礎(chǔ)上,在其他頁面添加指向目標(biāo)優(yōu)化頁的行為。
d)、重定向(re-direct)。使用刷新標(biāo)記(metarefresh)、CGI程序、Java、JavaScript或其他技術(shù),當(dāng)用戶進(jìn)人該頁時,迅速自動跳轉(zhuǎn)到另一個網(wǎng)頁。重定向使搜索引擎與用戶訪問到不同的網(wǎng)頁。
e)、偷換網(wǎng)頁。也稱誘餌行為(bait- -switch),是在一個網(wǎng)頁成功注冊并獲得較好排名后,用另一個內(nèi)容無關(guān)的網(wǎng)頁來替換它的行為。
f)、復(fù)制站點或內(nèi)容。通過復(fù)制整個網(wǎng)站或部分網(wǎng)頁內(nèi)容并分配以不同域名和服務(wù)器,以此欺騙搜索引擎對同一站點或同一頁面進(jìn)行多次索引的行為。鏡像站點(miiwsites)是此中典型。
g)、橋頁/門頁(bridge/doorway/portal/entry)。計對某一關(guān)鍵詞專門制作一個優(yōu)化的頁面,鏈接指向或重定向到目標(biāo)頁面。有時候為動態(tài)頁面建立靜態(tài)人口,或為不同的關(guān)鍵詞建立不同內(nèi)頁也會用到類似方法。但與橋頁不同的是,前者是網(wǎng)站實際內(nèi)容所需而建立的,是訪問者所需要的,而橋頁本身無實際內(nèi)容,只針對搜索引擎作了一堆充斥了關(guān)鍵詞的鏈接而巳。
h)、隱形頁面(cloakedpage)。指同一個網(wǎng)址下對不同的訪問者選擇性地返回不同的頁面內(nèi)容,搜索引擎得到了高度優(yōu)化的網(wǎng)頁內(nèi)容,而用戶則看到不同的內(nèi)容。
i)、重復(fù)注冊。違反網(wǎng)站提交紀(jì)律,突破時間間隔限制,將一個網(wǎng)頁在短時間內(nèi)反復(fù)提交給同一個搜索引擎以獲得收錄的做法。
j)、垃圾鏈接。加人 鏈接工廠 (亦稱大量鏈接機制)是由大量網(wǎng)頁交叉鏈接而構(gòu)成的一個網(wǎng)絡(luò)系統(tǒng)。一個站點加入 鏈接工廠 后,它可得到來自該系統(tǒng)中所有網(wǎng)頁的鏈接,同時作為交換,它需要 奉獻(xiàn) 自己的鏈接,以此方法來提升鏈接得分。
二、搜索引擎反作弊
1、為什么捜索引擎要反作弊
對于上述提到的搜索引擎作弊行為,幾乎所有搜索弓I擎都是反對的。SEOspam的破壞性是相當(dāng)巨大的,它不僅直接破壞了搜索引擎網(wǎng)站賴以生存的關(guān)鍵所在,即每日數(shù)以億計的用戶搜索體驗,同時也破壞了搜索引擎獲得收益的主要來源,如競價排名以及相關(guān)廣告。
搜索引擎反作弊類同于互聯(lián)網(wǎng)的病毒與反病毒。因此,作為搜索引擎,對待垃圾和作弊網(wǎng)站的態(tài)度也是高度一致:懲罰或者刪除。幾乎所有的捜索引擎官方站點也公布了一些原則,對作弊行為進(jìn)行鑒定,并給出了對應(yīng)的懲罰措施。比如2005年3月26日凌晨4點,忍無可忍的Google突然發(fā)力,將一大批spam 站點清除。
2、反作弊
搜索引擎作弊其實不僅僅是損害了搜索引擎擁有者的利益。從長遠(yuǎn)看,如果網(wǎng)站的本身質(zhì)量并沒有提高,而是通過搜索引擎作弊來吸引瀏覽者,那么網(wǎng)站最終還是得不到用戶的青睞,無法留住瀏覽者,最終受到傷害的還是網(wǎng)站本身。
雖然通過技術(shù)手段不可能完全杜絕各種搜索引擎作弊行為,但還是能夠有效減少這些行為。解決辦法如下:
a)、加強頁面內(nèi)容的智能判斷。對于關(guān)鍵字堆砌和虛假關(guān)鍵字這兩種作弊行為,應(yīng)加強智能判斷。例如從頁面的〈body〉 /body 部分 提取,而非〈title〉〈/title〉或者 meta〉〈/meta 部分;判斷關(guān)鍵宇是否僅在某一段落內(nèi)重復(fù),以去除惡意重復(fù)現(xiàn)象。對 于重定向這種行為,應(yīng)對頁面內(nèi)增加重定向分析。使用刷新標(biāo)記進(jìn)行重定向,可以在頁面內(nèi)容中進(jìn)行標(biāo)記判斷;使用JavaScript來進(jìn)行重定向,可以對頁 面中的JavaScript代碼進(jìn)行判斷。
b)、網(wǎng)絡(luò)爬蟲隱身。無論是隱形頁面、偷換頁面,還是重定向,都會對網(wǎng)站的當(dāng)前訪問者進(jìn)行判斷,從而對網(wǎng)絡(luò)爬蟲和普通用戶作出不同的反應(yīng)。搜索引擎應(yīng)該讓一部分網(wǎng)絡(luò)爬蟲隱身,裝扮成普通用戶來訪問網(wǎng)站,對網(wǎng)站進(jìn)行測試,便可以有效杜絕這種類型的作弊。
c)、網(wǎng)站歷史記錄。對網(wǎng)站的頁面變更記錄其歷史。一般來說一個W站的非內(nèi)容部分的頁面變化是很小的,如網(wǎng)站目錄結(jié)構(gòu)、頁面結(jié)構(gòu)、很多特殊連接都是不經(jīng) 常變化的。如果某一個網(wǎng)站變化較大,就有必要對此網(wǎng)站作進(jìn)一步的審核。這樣做可以杜絕偷換網(wǎng)頁這一作弊方法,并提高人工審核的效率。
d)、網(wǎng)站評級。一般來說,好的網(wǎng)站上的鏈接質(zhì)量也會很高,而一些垃圾網(wǎng)站的鏈接也多是與其相似的網(wǎng)站。也就是說,網(wǎng)站也是聚類生存的。因此,可以對網(wǎng)站進(jìn)行評級歸類,以有效預(yù)防通過垃鏈連接來作弊的網(wǎng)站。
通過以上四種方法,可以有效提高搜索引擎的反SEO作弊能力,但這樣并不能完全杜絕SEO作弊。要想提高搜索引擎的反作弊能力,還必須要人的加入,綜合使用各種方法,逐級分層審査。
第一層是提高技術(shù)手段。例如加強頁面的智能分析和網(wǎng)絡(luò)爬蟲的抓取能力,增加爬蟲隱身能力。其目的是進(jìn)行最底層的反作弊判斷,判斷的對象是頁面,由電腦進(jìn)行海量的重復(fù)性作業(yè)。
第二層是網(wǎng)站分析。通過網(wǎng)站的歷史記錄與網(wǎng)站評級系統(tǒng),對網(wǎng)站進(jìn)行分析評價。目的是從中篩去合法的,找出有SEO作弊嫌疑的網(wǎng)站,判斷的對象是網(wǎng)站,由電腦和人進(jìn)行比較篩選。
第三層是最終評審。由人對篩選出的嫌疑網(wǎng)站進(jìn)行試用、評審。判斷的對象是網(wǎng)站,完全由人完成,并得出最終結(jié)論。
通過電腦與人工的合作作業(yè),可以基本上杜絕搜索引擎優(yōu)化中的作弊行為,使搜索引擎的結(jié)果更符合瀏覽者的需要。
三、Google網(wǎng)頁評級系統(tǒng)
Google搜索引擎采用的核心軟件PageRank是由Google創(chuàng)始人開發(fā)出的一套用于網(wǎng)頁評級的系統(tǒng)。這是Google搜索排名算法中的一個組 成部分,級別從1到10級,10級為滿分,PK值越高說明該網(wǎng)頁在搜索排名中的地位越重要。也就是說,在其他條件相同的情況下,PR值高的網(wǎng)站在 Google搜索結(jié)果的排名中有優(yōu)先權(quán)。網(wǎng)頁級別由此成為Google所有網(wǎng)絡(luò)搜索工具的基礎(chǔ)。
1、Google對網(wǎng)頁級別的描述
作為組織管理工具,網(wǎng)頁級別利用了互聯(lián)網(wǎng)獨特的民主特性及其巨大的鏈接結(jié)構(gòu)。實質(zhì)上,當(dāng)從網(wǎng)頁A鏈接到網(wǎng)頁B時,Google就認(rèn)為A投了B 票。Google根據(jù)網(wǎng)頁的得票數(shù)評定其重要性。然而,除了考慮網(wǎng)頁得票數(shù)(即鏈接)的純數(shù)量之外,Google還要分析投票的網(wǎng)頁。重要的網(wǎng)頁所投出的票就會有更高的權(quán)重,并且有助于提高其他網(wǎng)頁的重要性。
重要的高質(zhì)量網(wǎng)頁會獲得較高的網(wǎng)頁級別。Google在排列其搜索結(jié)果時,都會考慮每個網(wǎng)頁的級別。當(dāng)然,如果不能滿足用戶的查詢要求,網(wǎng)頁級別再高,對用戶來說也毫無意義。因此,Google將網(wǎng)頁級別與完善的文本匹配技術(shù)結(jié)合在一起,為用戶找到最重要、最有用的網(wǎng)頁
Google所關(guān)注的遠(yuǎn)遠(yuǎn)不只是關(guān)鍵詞在網(wǎng)頁上出現(xiàn)的次數(shù),它還對該網(wǎng)頁的內(nèi)容(以及該網(wǎng)頁所鏈接的內(nèi)容)進(jìn)行全面檢査,從而確定該網(wǎng)頁是否滿足用戶的査詢要求。
2、PR值算法原理
PR值算法總體上基于下面兩個前提:
a)、 個網(wǎng)頁被多次引用,則它可能是很重要的;一個網(wǎng)頁雖然沒有被多次引用,但是被重要的網(wǎng)頁引用,則它也可能是很重要的;一個網(wǎng)頁的重要性被平均傳遞到它所引用的網(wǎng)頁。這種重要的網(wǎng)頁稱為權(quán)威(authoritive)網(wǎng)頁。
b)、假定用戶一開始隨機地訪問網(wǎng)頁集合中的一個網(wǎng)頁,然后跟隨網(wǎng)頁的鏈接向前瀏覽網(wǎng)頁,不回退瀏覽,那么瀏覽下 個網(wǎng)頁的概率就是被瀏覽網(wǎng)頁的PageRank值。
影響PR值的因素如下:
PR值體現(xiàn)為0~10的11個數(shù)值,在Google的工具欄上以一條橫向綠色柱狀圖顯示,0級情況下呈白色。它是針對網(wǎng)頁而不是網(wǎng)站,因此一個網(wǎng)站的首頁和內(nèi)頁往往有著迥然不同的PR值。根據(jù)PR值的算法原理,可知影響一個網(wǎng)站(首頁)PR值的因素主要包括:
1、網(wǎng)站的導(dǎo)人鏈接質(zhì)量。(a)根據(jù)前文對高質(zhì)量導(dǎo)入鏈接的分析,則獲得高PR值需要獲得來自網(wǎng)站的鏈接;(b)加人搜索引擎分類目錄;(c)與已經(jīng)加 人目錄的網(wǎng)站交換鏈接;(d)獲得來自PR值不低于4并與用戶主題相關(guān)或互補的網(wǎng)站的鏈接;(e)用戶鏈接出現(xiàn)在流量大、知名度高、頻繁更新的重要網(wǎng)站上 (如新聞源)。(f)與用戶交換鏈接的網(wǎng)站具有很少導(dǎo)出鏈接;(g)與內(nèi)容質(zhì)量高的網(wǎng)站鏈接(PR值上升潛力大)。
2、導(dǎo)出鏈接數(shù)量。根據(jù)PR計算原理,由于 一個網(wǎng)頁的重要性被平均傳遞到它所引用的網(wǎng)頁 ,反過來看,一個頁面內(nèi)過多地導(dǎo)出鏈接將潛在引起該頁PR值的流失。但從內(nèi)容的角度看,適當(dāng)數(shù)量的與主題有關(guān)聯(lián)的導(dǎo)出鏈接給搜索引擎帶來良好的印象。因此,一個頁面,尤其是首頁的導(dǎo)出鏈接數(shù)量的把握,應(yīng)該兼顧到PR值與關(guān)鍵詞內(nèi)容兩者之間的平衡,即控制導(dǎo)出鏈接數(shù)量,以不超過10個為宜。
3、搜索引擎收錄一個網(wǎng)站的頁面數(shù)量。在探討SEO的時候,人們過多關(guān)注核心關(guān)鍵詞排 名以及首頁的表現(xiàn)情況,卻往往忽略了一個極其重要的問題,即搜索引擎對一個網(wǎng)站收錄的頁面數(shù)量。后者在SEO中也有著極其重要的意義。一個用核心關(guān)鍵詞查 詢排名不佳的網(wǎng)站,可能由于被抓取大量網(wǎng)頁而在用戶使用其他關(guān)鍵詞查詢時內(nèi)頁獲得前三甲排名。由于用戶搜索時使用的關(guān)鍵詞具有分散性,使得這種情況往往給 網(wǎng)站帶來極大的訪問量。
正因為收錄頁面的數(shù)量直接影響訪問量,所以對PR值的影響也是很大的。被收錄頁面越多,主頁PR值越高。不過需要強調(diào)的是,此處所指的數(shù)量是指被收錄數(shù)與網(wǎng)站頁面總數(shù)的比值,而不是收錄頁面的絕對數(shù)值。但對各個搜索引擎來說,究竟達(dá)到多大的比值算是良好,目前還沒有相關(guān)的數(shù)據(jù)。
4、首頁PR的高低。盡管對PR的界定是針對網(wǎng)頁而不是網(wǎng)站,但由于每個網(wǎng)頁都依托某一網(wǎng)站而存在,首頁是推廣的核心頁面,網(wǎng)站 首頁PR高低對內(nèi)頁各PR也產(chǎn)生直接影響。 般而言,一個網(wǎng)站各頁面的PR值呈現(xiàn)以下走向:首頁 級頁面 二級頁面 三級頁面 每 深人一級,PR降低一或兩個檔次。更深層次可能就無法列人評級范圍了。當(dāng)然,如果一個深層內(nèi)頁有很多外部或內(nèi)部鏈接,情況則另當(dāng)別論。
5、文件類型。Google可以索引到的網(wǎng)頁和文件類型包括pdf、asp、jsp、html、shtml、xml、cfin、doc、xls、ppt、 rtf、wks、lwp、wri、swf。做成PDF格式的文件往往都是網(wǎng)站比較重要的內(nèi)容或文章。因此Google默認(rèn)PDF格式文件的PR值為3,高于一般HTML文件。同理,Google給予XML、PS、Woid、PowerPoint、Excel等類型頁面的PR值也比普通網(wǎng)頁文件高。因此,對 于網(wǎng)站比較有價值的內(nèi)容,建議做成pdf格式。
6、PR值的更新。Google每個月進(jìn)行一次徹底的數(shù)據(jù)更新(google dance),更新后的網(wǎng)站排名和導(dǎo)人鏈接都會有某些變化,但其PR更新時間一般要延遲至dance后三個月左右,而且網(wǎng)站的PR值相對穩(wěn)定,要上升或下降一級PR是很不容易的事情。
7、PR值的作用。由于網(wǎng)頁級別的高低直接受鏈接的影響,而鏈接僅是SEO的一個方面,PR的高低只能反映出SE0的部分效果。一個網(wǎng)頁如果擁有高PR值能夠 說明的僅是:a)網(wǎng)頁比較重要,擁有排名靠前的優(yōu)先權(quán),并不能與排名靠前直接劃上等號;b)具有獲得高質(zhì)量導(dǎo)入鏈接的談判優(yōu)勢;c)搜索引擎會加快對網(wǎng)頁 數(shù)據(jù)的更新;d)看上去挺美。
正因為具有排名靠前的優(yōu)先權(quán)和談判優(yōu)勢,使得高PR網(wǎng)站往往最終確實產(chǎn)生高排名,業(yè)內(nèi)不少人士就干脆直接將 PR與SEO劃等號,這不僅不正確,也不利于SEO實施。因為PR值不高的網(wǎng)站同樣有可能獲得好的排名,而PR值高的不見得有理想的排名。并且在這樣的思想指導(dǎo)下,人們往往片面追求鏈接效應(yīng),忽略了SEO對于內(nèi)容、結(jié)構(gòu)、關(guān)鍵詞等方面的分析和改進(jìn),而后者才是用戶和搜索引擎長期關(guān)注的焦點。網(wǎng)絡(luò)營銷人士認(rèn)為:PR值的高低應(yīng)該是包括SEO在內(nèi)的搜索引擎營銷所產(chǎn)生的自然結(jié)果,而不應(yīng)該作為追求的目標(biāo)。
對于搜索引擎優(yōu)化,各大搜索引擎的態(tài)度是不同的,有的并不表態(tài),有的公開支持。合法的搜索引擎優(yōu)化應(yīng)該是值得鼓勵的,可以為搜索引擎提供更為精確的網(wǎng)站索引。 搜索引擎優(yōu)化中的作弊行為是被各大搜索引擎一致拒絕并提供了各種處罰措施。要想完全杜絕搜索引擎排名中的作弊行為是不可能的,一個成功的搜索引擎應(yīng)必須要做到盡量避免索引到垃圾頁面。要做到這個目標(biāo),就必須從域名的分析到頁面內(nèi)容的抽取、從網(wǎng)站歷史行為到最新頁面狀態(tài)的檢索都進(jìn)行檢査??梢钥隙ǖ氖牵鞔笏阉饕娴姆醋鞅撞呗灾皇莿倓傞_始。
評論(0人參與,0條評論)
發(fā)布評論
最新評論