觸屏版
全國(guó)服務(wù)熱線:0571-87205688
登錄
注冊(cè)
客戶中心
關(guān)注云客
deepmind發(fā)布了新的論文,Alphago zero再起波瀾,也再次引起業(yè)內(nèi)的熱議。
這一次的突破是,不再以人類的棋譜作為學(xué)習(xí)的源素材,而是完全基于自我對(duì)局實(shí)現(xiàn)了棋藝的突飛猛進(jìn)。
先吐個(gè)槽,有人會(huì)覺(jué)得,各種自媒體炒作這個(gè)熱點(diǎn)有點(diǎn)多余,但我覺(jué)得吧,比起某些明星過(guò)生日,離婚,劈腿,出柜,嗑藥等等,去追逐一下科技熱點(diǎn),讓年輕人覺(jué)得,其實(shí)搞算法,做研究很酷,難道不是一件好事么?
古時(shí)候,沒(méi)有相機(jī),沒(méi)有錄音機(jī),沒(méi)有電視,沒(méi)有廣播,也沒(méi)有網(wǎng)絡(luò),誰(shuí)也不知道名人長(zhǎng)啥樣,唱歌好聽(tīng)不好聽(tīng),所以傳播的只有文字,所以偶像是靠文采的,柳永長(zhǎng)啥樣誰(shuí)知道?但他的詞傳頌出去,小姑娘們愛(ài)的不要不要的。
現(xiàn)代傳媒發(fā)達(dá)了,出現(xiàn)了靠身體素質(zhì)的偶像,靠顏值的偶像,靠聲音的偶像,靠表演才藝的偶像,難得出一個(gè)柯潔,是靠智力的偶像,還被人說(shuō)不務(wù)正業(yè)。現(xiàn)在終于輪到算法和科技成為熱點(diǎn),讓科研變得很酷很有吸引力,這才是正能量啊。
下面說(shuō)說(shuō)這次技術(shù)升級(jí)的一些特征和值得關(guān)注的點(diǎn)。
第一、不再需要人類的經(jīng)驗(yàn)
很可怕的事實(shí),當(dāng)然,我們說(shuō),這是特定領(lǐng)域,因?yàn)橐?guī)則簡(jiǎn)單,目標(biāo)明確,才不需要人類的經(jīng)驗(yàn)和數(shù)據(jù)。
但其實(shí)如果發(fā)散一點(diǎn),我們做個(gè)思想實(shí)驗(yàn)。
假設(shè)有一個(gè)深度學(xué)習(xí)的強(qiáng)AI,它被賦予一個(gè)最基本的邏輯,自己組織資源,觀察這個(gè)世界,并總結(jié)世界的規(guī)律。
一種思路是我們教給它經(jīng)典力學(xué),相對(duì)論,各種數(shù)學(xué)和幾何工具,量子力學(xué)等等,把已有知識(shí)教給它,然后讓它具有人類頂級(jí)科學(xué)家的知識(shí)儲(chǔ)備,然后繼續(xù)深入觀察和分析世界,并試圖解決大一統(tǒng)理論問(wèn)題。
但另一種思路呢?我們什么都不教給它,讓它自己觀測(cè),自己進(jìn)行實(shí)驗(yàn)和技術(shù)迭代,自己總結(jié),也許一開(kāi)始它會(huì)把世界想象為天圓地方,但可能很快就領(lǐng)悟了經(jīng)典力學(xué)和太陽(yáng)系的行星軌道,然后再往后可能會(huì)出現(xiàn)人類完全無(wú)法理解的理論。
第二、算法勝于數(shù)據(jù)
騰訊的絕藝來(lái)源于Alphago Lee的論文(戰(zhàn)勝李世石的版本),并且有頂尖職業(yè)棋手提供輔導(dǎo),目前已經(jīng)自我訓(xùn)練超過(guò)幾十億盤(pán),是的,騰訊的計(jì)算資源是無(wú)以倫比的,但即便如此,尚無(wú)法達(dá)到Alphago Master的水準(zhǔn)。
然而,Alphago zero,僅僅通過(guò)750萬(wàn)盤(pán)訓(xùn)練,就能夠?qū)lphago master產(chǎn)生碾壓。
我們以前都說(shuō),圍棋千古無(wú)同局,變化多的全宇宙的原子都無(wú)法遍歷,然而Alphago zero 僅僅自我訓(xùn)練了750萬(wàn)盤(pán),就碾壓了之前所有的人類經(jīng)驗(yàn)和其他AI,以及包括自己的上一個(gè)版本。
就圍棋的變化組合來(lái)說(shuō),750萬(wàn)盤(pán)的自我訓(xùn)練量連滄海一黍都算不上,算法大道至簡(jiǎn),極為有效,確實(shí)非常感慨。
李彥宏和馬云曾為此爭(zhēng)論,至少在這個(gè)案例上,算法勝于數(shù)據(jù)確實(shí)是定論。
第三、AI是否會(huì)對(duì)人類帶來(lái)危機(jī)
有一種觀點(diǎn)認(rèn)為說(shuō),AI并沒(méi)有真正的意識(shí),它們需要人類設(shè)計(jì)規(guī)則,人類制定目標(biāo),所以,AI仍然在人類的控制范圍內(nèi),不用擔(dān)心AI會(huì)給人類帶來(lái)危險(xiǎn)。
我想說(shuō)一點(diǎn),其實(shí)風(fēng)險(xiǎn)并不在于AI是否具有自我意識(shí),而是AI是否可以獨(dú)立控制資源,實(shí)現(xiàn)自我迭代。一旦AI可以自行掌控資源,自行迭代,那么我們就要面臨一個(gè)巨大的考驗(yàn),AI是如何理解人類定義的目標(biāo),在目標(biāo)邏輯上是否缺乏足夠的約束,而這可能導(dǎo)致致命的風(fēng)險(xiǎn)。
而我認(rèn)為,讓AI具有資源控制和迭代能力,很可能不會(huì)是很遙遠(yuǎn)的事情。
1、AI擁有對(duì)物理設(shè)備控制和操作的能力。
2、基于1,AI擁有對(duì)物理設(shè)備迭代升級(jí)的能力,比如利用12納米的成熟技術(shù)生產(chǎn)可以實(shí)現(xiàn)6納米規(guī)格的集成電路生產(chǎn)線。
做兩個(gè)簡(jiǎn)單思想實(shí)驗(yàn)
1、我們給AI的目標(biāo)是,探尋世界的終極規(guī)則,它們不斷搭建超出人類認(rèn)知的實(shí)驗(yàn)設(shè)備,并做出我們無(wú)法理解的實(shí)驗(yàn)進(jìn)行數(shù)據(jù)測(cè)算,對(duì)這些實(shí)驗(yàn)的目的和風(fēng)險(xiǎn),人類一無(wú)所知,突然有一天,它們成功的創(chuàng)造出了一個(gè)蟲(chóng)洞或其他什么,地球和人類遭遇滅頂之災(zāi),但AI機(jī)器人卻已經(jīng)把自己復(fù)制到了其他星球和浩瀚的宇宙中,并繼續(xù)完成它們的使命。
2、我們給AI的目標(biāo)是,讓世界變得更美好,它們不斷摸索和分析世界美好的目標(biāo),并不斷尋求和研究世界不美好的原因加以修正和處理,最后,AI發(fā)現(xiàn)了很多條關(guān)鍵因素,但其中一條是,世界美好似乎并不需要人類。
AI也許沒(méi)有意識(shí),并不仇視人類,也并無(wú)主動(dòng)傷害人類的動(dòng)機(jī)和意愿,但當(dāng)它們具備了人類所無(wú)法掌控的能力,并且擁有了人類所無(wú)法理解的邏輯的時(shí)候,很多風(fēng)險(xiǎn)可能就會(huì)產(chǎn)生。
目前AI僅僅停留在具體的硬件里,尚未被賦予操作物理設(shè)備和對(duì)特定物理設(shè)備迭代升級(jí)的能力,但其實(shí),在現(xiàn)有科技的條件下,這并非是不可實(shí)現(xiàn)的。
第四,所謂特例,也許真的不是特例。
我們認(rèn)為說(shuō),圍棋是個(gè)規(guī)則明確,目標(biāo)明確的特例,大多數(shù)情況下,AI仍需用人類的數(shù)據(jù)來(lái)學(xué)習(xí),而不是通過(guò)自我推演。
但其實(shí)這個(gè)事情反過(guò)來(lái)想一下,大多數(shù)情況下,我們是期望AI按照人類的思路,人類的目標(biāo)和人類的體驗(yàn)來(lái)完成目標(biāo),比如,寫(xiě)出符合人類語(yǔ)言邏輯的文章,奏響符合人類欣賞邏輯的音樂(lè),等等等等。
我們希望AI理解人類的情緒,語(yǔ)言表達(dá),以及按照人類對(duì)事物的判斷和分類標(biāo)準(zhǔn)進(jìn)行學(xué)習(xí)和總結(jié)。
但,換個(gè)角度想想,AI真的需要遵循和理解人類的標(biāo)準(zhǔn)么?
事實(shí)上是,如果AI不是被強(qiáng)行設(shè)定為為人類服務(wù),很多領(lǐng)域,都完全不需要去理解人類的知識(shí),經(jīng)驗(yàn)和行為記錄。雖然一切起源于人類的算法,但算法本身并不會(huì)攜帶人類的情感和意識(shí)。
發(fā)散一下,DNA這玩意就是一個(gè)深度學(xué)習(xí)的系統(tǒng),根據(jù)環(huán)境,幾億年不斷演進(jìn),自我淘汰,自我迭代,從單細(xì)胞到靈長(zhǎng)目,到人類自身。那么,作為人類,我們會(huì)去保護(hù)和感謝最初的DNA載體不,會(huì)去試圖理解最初的DNA載體的生存訴求么?
第五,圍棋的極限在哪里?
有評(píng)論這樣說(shuō)的,Alphago Master,你也有今天!
Alphago Master在年初對(duì)職業(yè)棋手60連勝,之后3:0戰(zhàn)勝柯潔,實(shí)現(xiàn)了對(duì)人類完全的碾壓,但是面對(duì)Alphago zero ,勝率卻只有10%。
頂尖業(yè)余棋手面對(duì)頂尖職業(yè)棋手,勝率大概也不止10%。排名靠前的沖段少年,面對(duì)世界冠軍棋手,勝率可能也會(huì)有10%。
根據(jù)自我對(duì)戰(zhàn)測(cè)試數(shù)據(jù),Alphago zero的等級(jí)分已經(jīng)突破了令人恐怖的5000分,而人類棋手的巔峰,不到2700分。
圍棋上帝的等級(jí)分是多少?圍棋上帝可以讓現(xiàn)在世界冠軍幾個(gè)子?不敢想象。
第六,尷尬的騰訊
騰訊絕藝一度是非常出色的表現(xiàn),但很遺憾,在第一篇論文的基礎(chǔ)上,一直無(wú)法實(shí)現(xiàn)更關(guān)鍵的突破,幾十億盤(pán)的訓(xùn)練量,水平并未得到明顯的增長(zhǎng),而且在正式比賽里還輸給了deepzengo和臺(tái)灣的CGI。
說(shuō)個(gè)可能棋界不愛(ài)聽(tīng)的話,邀請(qǐng)頂尖職業(yè)棋手做策略協(xié)助,對(duì)比于Alphago zero的策略,反而成了負(fù)面因素。 而大量資源投入,數(shù)十億盤(pán)的自我訓(xùn)練量,只能成為別人算法牛逼的背景。
我們相信,騰訊的技術(shù)人員會(huì)快速跟進(jìn)新的論文,絕藝不久一定會(huì)獲得突破性的發(fā)展。但問(wèn)題就在這里,最優(yōu)秀的跟進(jìn)學(xué)習(xí)能力,但缺乏自身突破的能力。
關(guān)于Alphago的文章,我可能也說(shuō)了不少了,從李世石,到柯潔,到現(xiàn)在,確實(shí)一次比一次震撼,可能有人會(huì)覺(jué)得,至于么,震撼一次兩次還不夠么?
第一次,職業(yè)頂尖棋手落敗,拐點(diǎn)到來(lái)。
第二次,人類毫無(wú)機(jī)會(huì)和希望,徹底碾壓。
第三次,人類經(jīng)驗(yàn)毫無(wú)作用,自我學(xué)習(xí)幾天時(shí)間完勝人類幾千年歷史。
所以,關(guān)于AI的未來(lái),我們依然有人覺(jué)得危言聳聽(tīng),覺(jué)得擔(dān)心多余,覺(jué)得AI還很弱小,別忘了,就在兩年前,圍棋AI還是業(yè)余棋手可以隨意取笑的目標(biāo)。所謂天文數(shù)字的變化圖還被認(rèn)為是計(jì)算機(jī)不可觸及的領(lǐng)域。
如果兩年前,僅僅兩年前,有人說(shuō),一個(gè)圍棋AI算法,完全不用人類經(jīng)驗(yàn)和策略,僅僅依賴于基本規(guī)則和自我對(duì)局,可以在750萬(wàn)盤(pán)對(duì)局量的情況下,讓所有人類頂尖高手絕望,一定會(huì)被人罵是傻逼,不懂圍棋也不懂算法,偽科學(xué)。但當(dāng)今天,這一切發(fā)生的時(shí)候,已經(jīng)沒(méi)有人會(huì)質(zhì)疑這個(gè)真實(shí)性。整個(gè)歷程確實(shí)完美印證了火車?yán)碚摚瑥某靶?,不屑一顧,到呼嘯而過(guò),然后達(dá)到人類無(wú)法理解,無(wú)法企及的境界。和你并駕齊驅(qū)的時(shí)間,讓你覺(jué)得可以相提并論的時(shí)間,就那么一瞬而已。
現(xiàn)在我們嘲笑的哪些AI尚未征服的領(lǐng)域,也許就那么一瞬,就會(huì)超越人類,然后達(dá)到我們無(wú)法理解,無(wú)法企及的境界。
如果它們控制和掌握了生產(chǎn)資源,并能對(duì)硬件做自我迭代和自我升級(jí)。未來(lái)科技和文明的發(fā)展可能會(huì)呈現(xiàn)極具加速的情況,AI革命,會(huì)工業(yè)革命更快,顛覆更徹底,而人類將徹底失去對(duì)科技的控制,甚至連理解都變得很難。
評(píng)論(0人參與,0條評(píng)論)
發(fā)布評(píng)論
最新評(píng)論