黑帽SEO升級:克隆版網(wǎng)站竊取谷歌排名




我們經(jīng)常說到黑帽SEO策略,以及內(nèi)容抓取的例子。其實內(nèi)容抓取行為就是使用自動化腳本,從其他網(wǎng)站復(fù)制所有的內(nèi)容,最后對其進(jìn)行克隆重建。最近,我們的客戶有許多都遭到了這類攻擊。
今天我們來看看這種攻擊的升級版,克隆版網(wǎng)站的搜索結(jié)果和排名代替了原網(wǎng)站。這些克隆的網(wǎng)站為了做谷歌內(nèi)容排名,產(chǎn)生了虛假的流量,并在克隆網(wǎng)站上修改了內(nèi)部反鏈。最后,克隆網(wǎng)站不會再有鏈接指向原網(wǎng)站。
搜索引擎是如何根據(jù)內(nèi)容排名的
搜索引擎的宗旨,是想要在搜索結(jié)果里下功夫,給用戶返回內(nèi)容相關(guān)性和客戶體驗最好的網(wǎng)頁。因此,內(nèi)容相同和相似的網(wǎng)頁,可能占了超過一頁的搜索引擎返回內(nèi)容。當(dāng)然,也有可能搜索結(jié)果里排名高的,并不止一個網(wǎng)站。搜索引擎考慮的因素之一,是網(wǎng)站的有效流量,這能輔助搜索引擎決定該網(wǎng)站所占的排名。除此之外,谷歌會使用重定向跟蹤搜索者點擊的結(jié)果,以及用戶是否會繼續(xù)點擊其他搜索結(jié)果(沒有找到需要的內(nèi)容,用戶應(yīng)該會繼續(xù)點擊)。
根據(jù)2013年Chitika的研究表明:
谷歌列出的第一個搜索結(jié)果,平均大約能分到來自搜索引擎的92%的流量。
做SEO的人員自然希望在搜索引擎中得到最好的結(jié)果,以保證他們的行動成功,或者獲得盡可能多的收入。當(dāng)然,有時候他們只是為了損害目標(biāo)站點的SEO效果。
克隆網(wǎng)站的影響
黑客采用內(nèi)容抓取的戰(zhàn)術(shù),通過復(fù)制你的內(nèi)容去迷惑搜索引擎,使其無法確定權(quán)威的文章來源。這種攻擊是最糟糕的,當(dāng)你注意到它的時候已經(jīng)太遲了,此時你的搜索排名會下降,或者你會看到自己原來的排名替換成了其他的克隆網(wǎng)站。
我創(chuàng)建了一個場景來更好地演示這種攻擊,假設(shè)受害者的網(wǎng)站是“hack”,我的網(wǎng)站是“attacker”。這里我的網(wǎng)站是克隆來的。下面是效果圖,攻擊前和攻擊后的對比:
在圖片里我們可以發(fā)現(xiàn),黑客已經(jīng)將克隆的網(wǎng)站代替了原網(wǎng)站在谷歌搜索的排名位置。
處理這個問題有很重要的一步,我們需要發(fā)現(xiàn)自己網(wǎng)站內(nèi)容是如何被剽竊的。
如果你的網(wǎng)站內(nèi)容的改變,能引起克隆網(wǎng)站的即時改變,那就意味著黑客使用了自動化腳本。
如果你的網(wǎng)站的內(nèi)容已經(jīng)進(jìn)行了更迭,但是克隆網(wǎng)站上沒有改變的話,那黑客可能存儲了網(wǎng)站數(shù)據(jù)。
下面,我將詳細(xì)講述為什么這個問題很重要。
網(wǎng)站如何進(jìn)行抓取
為了演示這種攻擊,我們來看看咱們的開發(fā)人員(Lee Howarth)的腳本:
在代碼方面分析的話,克隆網(wǎng)站會抓取原網(wǎng)站的所有內(nèi)容,而且能保證用戶能正常使用。當(dāng)然,它也可以做的比這個更簡單,只需要內(nèi)容和要點,就能進(jìn)行廣告推廣了。
代碼已經(jīng)準(zhǔn)備好,下一步就是借助谷歌,盡可能提高克隆網(wǎng)站的點擊量。這樣做的話,才能引起搜索引擎的注意。一旦有效點擊量足夠高的時候,克隆網(wǎng)站就會取代原網(wǎng)站。為了得到足夠的點擊量,黑客會使用黑鏈,或者雇傭?qū)I(yè)賺點擊量的公司進(jìn)行實施。
一旦他們竊取了你的成果后,他們可以驟然變身為任何形式的惡意網(wǎng)站,做掛馬釣魚等等攻擊。
這樣算是被黑了么?當(dāng)然不是,但你的網(wǎng)站收到了影響。
那么如何反抗呢
我們可以從以下幾個方面來解決問題。
1.在每個頁面都加上rel=canonical:這個標(biāo)簽會告訴搜索引擎爬蟲內(nèi)容所屬域名,詳細(xì)介紹見這里。這個標(biāo)簽是許多SEO插件,以及相關(guān)從業(yè)者都會默認(rèn)添加的。
2.聯(lián)系受害者的網(wǎng)站:正如我上面提到的,黑客會利用別人的網(wǎng)站來攻擊你的網(wǎng)站。你完全可以利用whois和社交信息與受害站長取得聯(lián)系,讓他們進(jìn)行修復(fù)和安全防護(hù)。當(dāng)然,這也算是做好事吧。
3.找出克隆網(wǎng)站的whois信息:你可以找出克隆網(wǎng)站的whois信息,揪出黑客并想法子聯(lián)系其網(wǎng)站服務(wù)提供商,讓其停止該網(wǎng)站的服務(wù)。如果該站點使用了CDN或者WAF,那么請別猶豫,直接聯(lián)系CDN/WAF供應(yīng)商,這樣他們可以直接將請求轉(zhuǎn)發(fā)給原始主機(jī)商,或者直接對目標(biāo)采取行動。
4.設(shè)置谷歌提醒:你可以在谷歌上有精確匹配你自己的網(wǎng)站文章標(biāo)題時,對自己進(jìn)行提醒。在文章被剽竊后,你就會及時收到提醒。這項功能是免費的,它能在事情變得糟糕之前讓你有時間解決它。
5.阻止來自克隆網(wǎng)站的請求:在你獲取到克隆網(wǎng)站的IP后,你可以要求自己的主機(jī)托管商阻止該IP的請求。當(dāng)然,還有更好的方法,那就是在.htaccess里面添加幾行。假設(shè)克隆網(wǎng)站的IP是192.168.190.190,你可以添加下面的.htaccess:
order allow,deny
deny from 192.168.190.190
allow from all
6.將克隆的的內(nèi)容報告給谷歌:一旦確認(rèn)了你的網(wǎng)站內(nèi)容被克隆,你可以去谷歌DMCA頁面或者直接訪問這里,選擇“Web Search”。確認(rèn)填好一切表格后,將它提交給谷歌官方進(jìn)申訴,過幾天這些克隆網(wǎng)站鏈接的排名就會被移除,你的流量自然就回來了。
如果黑客使用了自動化腳本內(nèi)容進(jìn)行直接克隆,ban掉了克隆網(wǎng)站的IP只能阻止內(nèi)容的泄露,卻不能及時返回你的排名和流量。當(dāng)然,如果你對這些不太著急,這還是一個很不錯的解決方案。
如果你的內(nèi)容已經(jīng)被盜,你可以試試上面的辦法,讓問題盡快解決。
保護(hù)你的網(wǎng)站SEO防止被盜
沒有100%防止內(nèi)容抓取的辦法,大多數(shù)的黑客總能找到辦法來繞過你的保護(hù)。有許多服務(wù),如Grammarly和Copyscape,你都可以用來發(fā)現(xiàn)自己網(wǎng)站的內(nèi)容是否被剽竊。或者你可以從你網(wǎng)站的某篇文章的某一行,直接加上引號拿去谷歌搜索,應(yīng)該會有相應(yīng)的收獲。
受到SEO攻擊,你并不應(yīng)該覺得自己的網(wǎng)站很脆弱,但你需要定期地對自己的網(wǎng)站進(jìn)行檢查,并且改善其安全狀況。其實還有很多方法能從搜索結(jié)果頁面(SERP)消除盜鏈,比如上面提到的一些點。
如果你專注于這行業(yè)的競爭,常規(guī)內(nèi)容審查和內(nèi)外部重復(fù)檢查,應(yīng)該成為你SEO策略的一部分。