過去一年,搜索引擎,或者擴大至互聯(lián)網行業(yè),最熱門的話題無疑是人工智能。過去10幾年,SEO技術和方法其實沒什么大變化,這些年來我第一次覺得,不久的將來,SEO將被人工智能徹底改變。
上篇關于用戶訪問數(shù)據(jù)是否影響排名的帖子里提到,到目前為止,搜索引擎工程師多次否認排名算法中使用了他們自己的網站流量統(tǒng)計數(shù)據(jù)。可能的原因包括:
噪聲太大,太容易作弊??纯匆郧白鳇c擊器,現(xiàn)在做百度快排的有多少,就知道作弊的市場有多大了。不僅給自己刷,還有給競爭對手刷的,把跳出率刷高。
不同場景,用戶行為方式不同。跳出率高,不一定代表頁面質量不高。
有的網站沒有用搜索引擎的統(tǒng)計服務,怎么給這些網站排名?
但我們又真實地觀察到用戶訪問數(shù)據(jù)確實影響了頁面排名,這是不是有矛盾呢?人工智能也許就是答案。
去年寫了AlphaGo、深度學習與SEO后,在網上看到有人說我在胡扯,別看到個新名詞就往SEO扯。不知道一年后,是不是還有人覺得人工智能將影響、改變SEO的想法是胡扯。
人工智能近期發(fā)展
先看看過去幾年人工智能領域值得注意、又和搜索有關的幾件事:
2011年,吳恩達創(chuàng)建了Google Brain,一個超大規(guī)模的人工神經網絡。可能是最早的Google人工智能項目。
2014年5月,吳恩達加入百度,任首席科學家,主要負責的肯定也是AI。2017年3月20號,吳恩達辭職。這個和人工智能本身應該無關,和新老板有關,看下面。
2015年,Google上線深度學習為基礎的算法RankBrain,并且聲稱RankBrain是第三大排名因素。(前兩大排名因素是內容和鏈接)RankBrain主要用于找到與用戶查詢詞不完全匹配(因而傳統(tǒng)排名算法不太有效)、但其實很好回答了用戶查詢的那些頁面。記住這句有點拗口的話,因為百度有與此類似的算法,而且比Google更早使用,下次再寫。
2015年10月,AlphaGo以5:0戰(zhàn)勝歐洲圍棋冠軍樊麾。這條消息2016年1月才出來。
2016年3月,AlphaGo以4:1勝李世石。李世石贏的那一盤可能是人類戰(zhàn)勝AI的最后一局棋。
2016年12月29號到2017年初的短短幾天內,以Master為用戶名的AlphaGo在弈城、野狐網絡平臺上,快棋60:0狂勝中日韓幾乎所有人類最高手,包括柯潔、聶衛(wèi)平、古力、常昊、樸廷桓、井山裕太…..平了一局,是因為網絡斷線。
2017年1月,原微軟全球副總裁陸奇加入百度,任總裁。李彥宏在歡迎詞里特意提到“同時,陸奇還是人工智能領域世界級的技術權威?!俣纫呀洓Q定將人工智能列為公司未來十年最重要的戰(zhàn)略方向……陸奇的加盟將極大地確保這一戰(zhàn)略得以順利實現(xiàn)”。
2016年9月以來,Google陸續(xù)上線各語種的采用深度學習方法的谷歌翻譯。本來我也沒太注意這個新聞,偶然用了一下Google翻譯,水準之高,大大出乎我的想象。
人工智能領域領頭的公司,剛好都是搜索引擎,是碰巧?Google研發(fā)AlphaGo只是為了下棋?只是為了無人汽車?百度人工智能團隊現(xiàn)在發(fā)展到了1300人,挖吳恩達,挖陸奇,是為了組團參加最強大腦?
人工智能用于搜索
即使沒有RankBrain這種確定使用人工智能的算法,我們也能猜到,搜索引擎花這么大精力研究人工智能,肯定不止是在外圍或新業(yè)務上使用,他們沒理由不把人工智能用在自己的核心業(yè)務,也就是搜索上。
人工智能講徹底改變SEO仔細思考一下就知道,AlphaGo下圍棋與搜索排名要解決的問題看似誰也不挨誰,但其本質是非常相像的,是可以用同一種方式解決的:
AlphaGo通過學習無數(shù)盤棋,其中有人類的歷史棋局,更多的是AlphaGo自我對局,累積海量數(shù)據(jù),面對某一盤面時做出判斷:下一手,子下在哪里勝率比較高?
搜索引擎排名算法通過學習質量評估員給出的數(shù)據(jù)、搜索用戶點擊訪問數(shù)據(jù)等,面對某一個頁面時做出判斷:這個頁面是高質量還是低質量的?這個頁面作弊了嗎?這個頁面與查詢詞相關還是不相關?
傳統(tǒng)搜索算法要回答上面問題時,需要工程師根據(jù)常識、工程知識、情懷、用戶反饋等情況,選出排名因素,調整排名因素的權重,按既定的公式計算出答案。人工智能為基礎的算法不需要工程師告訴它使用什么排名因素,而是自己去學習,自己琢磨用哪些排名因素,各占多少權重。人工智能考慮的因素很可能是會令人類覺得莫名其妙的。
吳軍老師在《智能時代》中說過一句話,可以特別貼切地用于理解這種情形:在智能時代,可以在大數(shù)據(jù)中直接找到答案,雖然可能不知道原因(大意)。傳統(tǒng)搜索算法,工程師要知道原因,才能寫算法。人工智能直接從數(shù)據(jù)中找答案,雖然工程師都不知道原因。
人工智能的最大缺點,對人來說的缺點,它對人來說是個黑盒子,工程師也不知道它是怎么算的,根據(jù)什么算的。結果正確時,一切都挺好,但結果不大對頭時,工程師也不知道為什么錯了,還不好debug。也許由于這個原因,搜索引擎算法的核心現(xiàn)在還沒被人工智能取代,搜索引擎需要很謹慎,不然會錯得自己都不知道為什么錯。
人工智能怎樣影響SEO?
回到最前面的問題,用戶點擊、訪問等行為是否是排名因素?是的話,怎樣解決噪聲、作弊問題?沒有用搜索引擎統(tǒng)計服務的網站,無法確切知道訪問深度、停留時間等,這又怎么辦?
可以設想一下,算法可能不把用戶訪問數(shù)據(jù)作為直接排名因素,但可以作為某種驗證和質量控制方式,比如在傳統(tǒng)排名算法計算出相關頁面后,人工智能算法挑出與已知作弊頁面有相同訪問特征和其它特征的頁面,降低其排名或者干脆不返回。這里要記得人工智能潛在的驚人的準確率。記得去年中Google就說過,AlphaGo當時大致相當于人類13段棋手,年底的棋局似乎驗證了這很可能不是吹牛。柯潔和聶衛(wèi)平等人與Master對局后都表達過大致這么個意思:看了AlphaGo/Master的棋,覺得人類一些對圍棋的認識很可能是錯的。
這種判斷的驚人準確性,也許以后對黑帽SEO是個無法挽回的打擊。如果搜索引擎算法判斷一個頁面是否作弊時,具有13段棋手、遠遠超出人類的水平和準確率,那么我們凡人該怎么作弊?
與此類似,如果網站沒有使用搜索引擎的流量統(tǒng)計服務,人工智能可能會判斷,這個網站A具有特征x, y, z…,另一堆使用了自己統(tǒng)計服務的網站同樣具有特征x, y, z…..,預估網站A的訪問深度、停留時間等和那些已知網站相同。這里,特征x, y, z……是什么,是人工智能自己學習出來的,很可能有人類意想不到、覺得毫無關系的東西。而基于人工智能的駭人能力,結論很可能是正確的。
人工智能對SEO的關鍵詞研究、頁面文案寫作、網站結構等方面都會產生顛覆式的影響。這篇只是開了個頭,以后再繼續(xù)討論。
評論(0人參與,0條評論)
發(fā)布評論
最新評論