POST TIME:2018-12-03 17:23
deepmind發(fā)布了新的論文,Alphago zero再起波濤,也再次引起業(yè)內(nèi)的熱議。 這一次的突破是,不再以人類的棋譜作為學(xué)習(xí)的源素材,而是完全基于自我對(duì)局實(shí)現(xiàn)了棋藝的突飛猛進(jìn)。 先吐個(gè)槽,有人會(huì)覺得,各種自媒體炒作這個(gè)熱點(diǎn)有點(diǎn)多余,但我覺得吧,比起某些明星過生日,離婚,劈腿,出柜,嗑藥等等,去追逐一下科技熱點(diǎn),讓年輕人覺得,其實(shí)搞算法,做研究很酷,難道不是一件好事么? 古時(shí)候,沒有相機(jī),沒有錄音機(jī),沒有電視,沒有廣播,也沒有網(wǎng)絡(luò),誰也不知道名人長啥樣,唱歌好聽欠好聽,所以傳播的只有文字,所以偶像是靠文采的,柳永長啥樣誰知道?但他的詞傳頌出去,小姑娘們愛的不要不要的。 現(xiàn)代傳媒發(fā)達(dá)了,出現(xiàn)了靠身體本質(zhì)的偶像,靠顏值的偶像,靠聲音的偶像,靠演出才藝的偶像,難得出一個(gè)柯潔,是靠智力的偶像,還被人說吊兒郎當(dāng)。現(xiàn)在終于輪到算法和科技成為熱點(diǎn),讓科研變得很酷很有吸引力,這才是正能量啊。 下面說說這次技術(shù)升級(jí)的一些特征和值得關(guān)注的點(diǎn)。 第一、不再需要人類的經(jīng)驗(yàn) 很可怕的事實(shí),當(dāng)然,我們說,這是特定領(lǐng)域,因?yàn)橐?guī)則簡(jiǎn)單,目標(biāo)明確,才不需要人類的經(jīng)驗(yàn)和數(shù)據(jù)。 但其實(shí)如果發(fā)散一點(diǎn),我們做個(gè)思想實(shí)驗(yàn)。 假設(shè)有一個(gè)深度學(xué)習(xí)的強(qiáng)AI,它被賦予一個(gè)最基本的邏輯,本身組織資源,不雅觀察這個(gè)世界,并總結(jié)世界的規(guī)律。 一種思路是我們教給它經(jīng)典力學(xué),相對(duì)論,各種數(shù)學(xué)和幾何工具,量子力學(xué)等等,把已有知識(shí)教給它,然后讓它具有人類頂級(jí)科學(xué)家的知識(shí)儲(chǔ)備,然后繼續(xù)深入不雅觀察和分析世界,并試圖解決大一統(tǒng)理論問題。 但另一種思路呢?我們什么都不教給它,讓它本身不雅觀測(cè),本身進(jìn)行實(shí)驗(yàn)和技術(shù)迭代,本身總結(jié),也許一開始它會(huì)把世界想象為天圓地方,但可能很快就領(lǐng)悟了經(jīng)典力學(xué)和太陽系的行星軌道,然后再往后可能會(huì)出現(xiàn)人類完全無法理解的理論。 第二、算法勝于數(shù)據(jù) 騰訊的絕藝來源于Alphago Lee的論文(戰(zhàn)勝李世石的版本),而且有頂尖職業(yè)棋手提供輔導(dǎo),目前已經(jīng)自我訓(xùn)練超過幾十億盤,是的,騰訊的計(jì)算資源是無以倫比的,但即便如此,尚無法達(dá)到Alphago Master的水準(zhǔn)。 然而,Alphago zero,僅僅通過750萬盤訓(xùn)練,就能夠?qū)lphago master產(chǎn)生碾壓。 我們以前都說,圍棋千古無同局,變革多的全宇宙的原子都無法遍歷,然而Alphago zero 僅僅自我訓(xùn)練了750萬盤,就碾壓了之前所有的人類經(jīng)驗(yàn)和其他AI,以及包孕本身的上一個(gè)版本。 就圍棋的變革組合來說,750萬盤的自我訓(xùn)練量連滄海一黍都算不上,算法大道至簡(jiǎn),極為有效,確實(shí)非常感慨。 李彥宏和馬云曾為此爭(zhēng)論,至少在這個(gè)案例上,算法勝于數(shù)據(jù)確實(shí)是定論。 第三、AI是否會(huì)對(duì)人類帶來危機(jī) 有一種不雅觀點(diǎn)認(rèn)為說,AI并沒有真正的意識(shí),它們需要人類設(shè)計(jì)規(guī)則,人類制定目標(biāo),所以,AI仍然在人類的控制范圍內(nèi),不消擔(dān)心AI會(huì)給人類帶來危險(xiǎn)。 我想說一點(diǎn),其實(shí)風(fēng)險(xiǎn)并不在于AI是否具有自我意識(shí),而是AI是否可以獨(dú)立控制資源,實(shí)現(xiàn)自我迭代。一旦AI可以自行掌控資源,自行迭代,那么我們就要面臨一個(gè)巨大的考驗(yàn),AI是如何理解人類定義的目標(biāo),在目標(biāo)邏輯上是否缺乏足夠的約束,而這可能導(dǎo)致致命的風(fēng)險(xiǎn)。 而我認(rèn)為,讓AI具有資源控制和迭代能力,很可能不會(huì)是很遙遠(yuǎn)的事情。 1、AI擁有對(duì)物理設(shè)備控制和操作的能力。
2、基于1,AI擁有對(duì)物理設(shè)備迭代升級(jí)的能力,好比利用12納米的成熟技術(shù)生產(chǎn)可以實(shí)現(xiàn)6納米規(guī)格的集成電路生產(chǎn)線。 做兩個(gè)簡(jiǎn)單思想實(shí)驗(yàn)
1、我們給AI的目標(biāo)是,探尋世界的終極規(guī)則,它們不停搭建超出人類認(rèn)知的實(shí)驗(yàn)設(shè)備,并做出我們無法理解的實(shí)驗(yàn)進(jìn)行數(shù)據(jù)測(cè)算,對(duì)這些實(shí)驗(yàn)的目的和風(fēng)險(xiǎn),人類一無所知,突然有一天,它們成功的創(chuàng)造出了一個(gè)蟲洞或其他什么,地球和人類遭遇滅頂之災(zāi),但AI機(jī)器人卻已經(jīng)把本身復(fù)制到了其他星球和浩瀚的宇宙中,并繼續(xù)完成它們的使命。 2、我們給AI的目標(biāo)是,讓世界變得更美好,它們不停摸索和分析世界美好的目標(biāo),并不停尋求和研究世界不美好的原因加以修正和處理,最后,AI發(fā)現(xiàn)了很多條關(guān)鍵因素,但其中一條是,世界美好似乎并不需要人類。