觸屏版
全國(guó)服務(wù)熱線:0571-87205688
1月28號(hào),Nature雜志報(bào)道,Google旗下公司DeepMind(以前收購(gòu)的)開(kāi)發(fā)的一款名為 AlphaGo的人工智能,在2015年10月份以5:0戰(zhàn)勝歐洲圍棋冠軍,老職業(yè)二段樊麾。一石激起千層浪,人工智能最難戰(zhàn)勝人類(lèi)的最后一個(gè)游戲,失守了,人工智能已經(jīng)達(dá)到職業(yè)圍棋水平了。
一時(shí)間,深度學(xué)習(xí)、機(jī)器學(xué)習(xí)、AlphaGo、神經(jīng)網(wǎng)絡(luò)等等這些概念鋪天蓋地。Google不是搜索引擎嗎?這些東西和搜索,和SEO有什么關(guān)系?說(shuō)說(shuō)我的理解。
先聲明一下,下面涉及的深度學(xué)習(xí)等概念,很可能我的理解和表述是非常粗淺的,甚至是錯(cuò)誤的。雖然我也是理工出身的,所學(xué)專(zhuān)業(yè)聽(tīng)起來(lái)還挺艱深,微波與電磁場(chǎng),但那是25年前的事啦。現(xiàn)在看技術(shù)內(nèi)容只能稀里糊涂了解個(gè)大概了。想了解準(zhǔn)確細(xì)節(jié)的讀者,還是網(wǎng)上搜一下比較保險(xiǎn)。
什么是深度學(xué)習(xí)?
深度學(xué)習(xí)(deep learning)是機(jī)器學(xué)習(xí)的(machine learning)一個(gè)分支領(lǐng)域。
多層人工神經(jīng)網(wǎng)絡(luò)(artificial neural networks)模擬接近了人腦處理信息時(shí)從低層到高層不斷抽象化的過(guò)程。深度學(xué)習(xí)正是將低層特征分層抽象化為高層特征表達(dá),原來(lái)的目的就是模擬多層神經(jīng)網(wǎng)絡(luò)。神經(jīng)網(wǎng)絡(luò)研究幾十年了,沉寂了一段時(shí)間,近幾年深度學(xué)習(xí)才又挖掘出其潛力。
深度學(xué)習(xí)的一個(gè)重要特點(diǎn)是,它不需要人工輸入或標(biāo)注特征,而是通過(guò)海量數(shù)據(jù)自動(dòng)學(xué)習(xí)特征,也就是所謂無(wú)監(jiān)督學(xué)習(xí)(unsupervised learning)。所以大數(shù)據(jù)和深度學(xué)習(xí)也攪合在一起。
深度學(xué)習(xí)另一個(gè)特點(diǎn)是與具體領(lǐng)域無(wú)關(guān)(domain independent),既可以用在圍棋,也可以用在搜索或其他方面。所以才會(huì)有這篇帖子。
Google、Facebook、百度在深度學(xué)習(xí)領(lǐng)域都有很多進(jìn)展,尤其是在人臉識(shí)別、圖像識(shí)別、語(yǔ)音識(shí)別、翻譯等方面。這方面報(bào)道挺多的。
深度學(xué)習(xí)用在搜索引擎上是個(gè)什么情況?
以前經(jīng)典的搜索排名算法是由工程師選擇用哪些頁(yè)面特征(也就是排名因素)來(lái)排名,各個(gè)特征占多少權(quán)重,這些都是工程師決定并寫(xiě)在程序里的,然后測(cè)試效果,再修正。
以深度學(xué)習(xí)為基礎(chǔ)的排名算法完全不是這么個(gè)過(guò)程。深度學(xué)習(xí)的方法是,用大量數(shù)據(jù)對(duì)程序進(jìn)行訓(xùn)練,由程序自己學(xué)習(xí)應(yīng)該用哪些特征來(lái)排名。換句話說(shuō),告訴深度學(xué)習(xí)排名算法,這些已知頁(yè)面是高質(zhì)量的,那些已知頁(yè)面是低質(zhì)量的,那到底高質(zhì)量頁(yè)面應(yīng)該有什么特征呢?也就是面對(duì)新頁(yè)面時(shí)該用哪些特征來(lái)排名?各種特征占多大比重?讓算法自己琢磨去。
這些學(xué)習(xí)數(shù)據(jù)哪里來(lái)的??jī)蓚€(gè)明顯的來(lái)源可能是:
1)Google現(xiàn)有經(jīng)典算法做測(cè)試時(shí)的數(shù)據(jù)。搜索引擎正式上線新算法前都會(huì)做測(cè)試的,給部分用戶(hù)返回新算法結(jié)果,然后監(jiān)測(cè)點(diǎn)擊率、跳出率、停留時(shí)間、頁(yè)面互動(dòng)性、轉(zhuǎn)化率、變換查詢(xún)?cè)~率等數(shù)據(jù),以判斷新算法有效性。
2)Google有不少人工質(zhì)量評(píng)估員,而且老早就有,他們會(huì)評(píng)測(cè)特定頁(yè)面是高質(zhì)量還是低質(zhì)量。這些評(píng)估數(shù)據(jù)不直接影響所評(píng)估頁(yè)面的排名,但會(huì)顯示出算法有效性。這些數(shù)據(jù)簡(jiǎn)直就是現(xiàn)成的深度學(xué)習(xí)訓(xùn)練數(shù)據(jù)。去年11月Google剛剛公開(kāi)了最新版本的人工質(zhì)量評(píng)估指南,建議大家下載來(lái)看看。
現(xiàn)在問(wèn)題來(lái)了,這種方法靠譜嗎?
如前所述,深度學(xué)習(xí)算法就是個(gè)黑箱啊,完全不用人工告訴它找什么特征,而是它自己學(xué)習(xí)該找什么特征,會(huì)找出什么特征誰(shuí)也不知道,有些特征可能人類(lèi)壓根兒不會(huì)想到。很可能以后搜索引擎工程師也不知道排名因素有哪些了,也不知道一個(gè)頁(yè)面為什么會(huì)有好的排名。再想一遍:連搜索引擎工程師也不知道排名因素是什么。這和我們的常識(shí)、直覺(jué)是不是都有相當(dāng)沖突了呢?
這么整,能行嗎?
事實(shí)恰恰表明,能行。AlphaGo能戰(zhàn)勝?lài)迓殬I(yè)二段,乍看起來(lái),職業(yè)二段離人類(lèi)頂尖高手還有很大差距??蓳Q個(gè)角度想,這世界上能達(dá)到職業(yè)二段的人類(lèi)有幾個(gè)?記得前些天看報(bào)道,能贏職業(yè)二段的人類(lèi)不超過(guò)1千個(gè)。
這種水平,可以快樂(lè)地完虐我們幾十億人。我打了5,6年羽毛球,我前幾天剛剛9歲的女兒,在經(jīng)過(guò)4個(gè)月每周一次的業(yè)余訓(xùn)練后,我要贏她必須很認(rèn)真費(fèi)勁了。這只是新加坡,只是一個(gè)業(yè)余教練,每周兩個(gè)小時(shí),我無(wú)法想象,我們普通愛(ài)好者與職業(yè)水平的差距那是有多大。
站長(zhǎng)、SEO們,少說(shuō)這世界上大概得有個(gè)幾百萬(wàn)吧?所以我們就是普通人。現(xiàn)在告訴我們,判斷我們頁(yè)面質(zhì)量的算法,其判斷力目前是所有人類(lèi)的前1千名,年底可能是所有人類(lèi)前10名。這是什么感覺(jué)?這是有點(diǎn)絕望的感覺(jué)--就別想著鉆空子啦。
也許熊貓更新或企鵝更新就用了深度學(xué)習(xí)?
深度學(xué)習(xí)真的有這么厲害嗎?
其實(shí)深度學(xué)習(xí)近兩年已經(jīng)取得不少以前不敢想象的成就。
2012年,Google Brain項(xiàng)目使用大量圖片對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,系統(tǒng)經(jīng)過(guò)訓(xùn)練后能辨別出:這是一只貓。重要的是,沒(méi)有輸入貓長(zhǎng)什么樣這類(lèi)信息,是系統(tǒng)自己“領(lǐng)悟”了貓這個(gè)概念。
2015年,深度學(xué)習(xí)算法的人臉識(shí)別率達(dá)到了99.47%,甚至超過(guò)了人眼。
AlphaGo將在3月份挑戰(zhàn)韓國(guó)九段、世界冠軍李世石。雖然我基本不懂圍棋,但樂(lè)觀預(yù)測(cè)一下吧,我覺(jué)得AlphaGo會(huì)贏。原因是,半年過(guò)去了,AlphaGo的訓(xùn)練量又增加了幾千萬(wàn)局棋譜,其棋力的增長(zhǎng)不是線性的啊。
深度學(xué)習(xí)對(duì)SEO意味著什么?
就我個(gè)人來(lái)說(shuō),深度學(xué)習(xí)對(duì)SEO的影響目前還不明朗,還需要一段時(shí)間觀察、思考。以后有想法了再來(lái)交流。現(xiàn)在需要做好心理準(zhǔn)備,搜索引擎判斷頁(yè)面質(zhì)量的準(zhǔn)確度可能會(huì)有質(zhì)的飛躍,鉆空子的難度將大大提高。
估計(jì)還是有做中文SEO的心里在問(wèn),這對(duì)百度SEO有卵用啊?多寫(xiě)寫(xiě)百度啊?那么請(qǐng)思考百度為什么花大價(jià)錢(qián)成立百度深度學(xué)習(xí)研究院?肯定不是閑的了。百度把深度學(xué)習(xí)領(lǐng)域最牛的人物之一、Google Brain項(xiàng)目創(chuàng)建人吳恩達(dá)都給挖來(lái)了。這個(gè)吳恩達(dá)高中還是在新加坡上的呢,萊佛士書(shū)院,第一名校。這里有吳恩達(dá)講機(jī)器學(xué)習(xí)的近20小時(shí)的線上教程。有互聯(lián)網(wǎng)真好,不然怎么能輕易看到、聽(tīng)到大師親自講課。
最后來(lái)點(diǎn)陰謀論。就在今天,Google搜索的最高負(fù)責(zé)人,Amit Singhal,辭職了。幾年前,他對(duì)排名算法中使用機(jī)器學(xué)習(xí)是有些排斥的。接替他的是誰(shuí)呢?John Giannandrea,原Google人工智能部門(mén)的負(fù)責(zé)人。難道由工程師設(shè)計(jì)規(guī)則的算法已成過(guò)去,以深度學(xué)習(xí)為代表的人工智能算法要全面登上舞臺(tái)了?
哪些SEO方法會(huì)被搜索引擎認(rèn)為是作弊
網(wǎng)站備案需要注意什么
如何降低域名被劫持風(fēng)險(xiǎn),減少損失
網(wǎng)站優(yōu)化中外鏈優(yōu)化的七種方法全解
網(wǎng)站優(yōu)化前期的策劃思路和優(yōu)化細(xì)節(jié)分析
網(wǎng)站關(guān)鍵詞排名浮動(dòng)的原因分析及解決方法
網(wǎng)站SEO優(yōu)化過(guò)程中排名下降的原因分析及解決方法
網(wǎng)站優(yōu)化中外鏈優(yōu)化的七種方法全解
企業(yè)網(wǎng)站SEO優(yōu)化方案
你的SEO學(xué)習(xí)方法可能把你帶偏了
評(píng)論(0人參與,0條評(píng)論)
發(fā)布評(píng)論
最新評(píng)論