摘要:“這是一場新鮮而陌生的比賽,是全新的挑戰(zhàn)。很難保證5比0全勝,畢竟我的對手從來不會失誤?!?/p>
李世石對戰(zhàn)AlphaGo,首番棋誰會贏?
一方是擁有十多個圍棋世界冠軍頭銜的最高級別人類選手;一方是現(xiàn)階段人工智能領域最厲害的圍棋程序,北京時間今日(3月9日)12時,全球都會將目光聚焦首爾。
“這是一場新鮮而陌生的比賽,是全新的挑戰(zhàn)。我很難保證5比0全勝,畢竟我的對手從來不會失誤?!弊蛉盏馁惽鞍l(fā)布會上,李世石雖然一改此前的自信滿滿,但依舊認為“目前還是人類比人工智能強”。
去年10月,歐洲圍棋冠軍樊麾曾輸給AlphaGo,但不少圍棋高手研究對戰(zhàn)棋譜后,都指其有“放水”嫌疑。對此,作為AlphaGo的設計者,谷歌人工智能公司DeepMind的CEO杰米斯·哈薩比斯在發(fā)布會上表示:“大家看到的AlphaGo并不是它能力的全部,它這一刻仍在憑借著其人工智能技術,對棋譜進行學習。相信AlphaGo能在比賽時展示不同的一面?!?/p>
曾歷任韓國科學技術院人工智能院士、現(xiàn)就職于韓國頂尖民營研究所HandySoftware的李承鎬(音譯)博士在接受《第一財經(jīng)日報》記者專訪時表示,無論這場對決孰勝孰負,最終的贏家都將是人類自己。
圍棋界:人肯定贏
對于人機大戰(zhàn)結果的預測,中韓圍棋界都站在人類一邊。
3月7日晚,棋圣聶衛(wèi)平向包括《第一財經(jīng)日報》在內的媒體表示,人工智能缺乏判斷力,與人類棋手對弈很難取勝。
“很多職業(yè)棋手,包括最頂尖的職業(yè)選手,(對于局勢的)看法會有很多分歧,比如李世石認為形勢可以,而柯潔可能認為不行。對于圍棋的判斷,是計算機的大難題,我不相信現(xiàn)在有電腦能突破這個,所以人和電腦下,百分之一百是人贏?!甭櫺l(wèi)平表示。
聶衛(wèi)平的依據(jù)在于,圍棋變化可以歸結為361的階乘,本身就是一個無限大的數(shù),其中還包含打二還一、打三還一、打結、倒撲等各種技法,可以說是變化無窮。
“李世石最近的狀態(tài)非常好?!蓖惶欤袊鴩暹x手柯潔表示。言下之意,目前的人工智能還不足以挑戰(zhàn)現(xiàn)役一流圍棋棋手。
此前,柯潔曾多次擊敗李世石,并在不久前收到了來自國內異構智能公司圍棋AI“異構神機”的挑戰(zhàn)。但他并未應戰(zhàn)。
韓國女棋手尹英敏(音譯)也站在李世石這邊。被譽為“韓國圍棋推廣第一人”的她昨日向本報記者表示:“按照雙方水平來看,李世石九段不僅會勝出,而且會以壓倒性的優(yōu)勢勝出,如果李世石輸?shù)粢粓龆紩徽J為是重大失誤?!?/p>
“但我們需要注意到,本次比賽的賽制設計對于AlphaGo比較有利?!币⒚粞a充道。
據(jù)了解,此次人機交手將大戰(zhàn)5盤,日程分別是9日、10日、12日、13日和15日,比賽在韓國時間下午1時(北京時間12時)開始。尹英敏認為:“在這種匆忙日程下,人類的疲勞度將會上升,但計算機卻不會疲勞?!?/p>
其次,雙方各有2小時的布局時間及3次60秒的讀秒(棋手將限時用完后的倒計時時間)。每場比賽預計需要4~5個小時。“充裕的時間為計算器的運算提供了有利條件?!币⒚舯硎?,AlphaGo的另一個優(yōu)勢是,而本次對局使用的是中國圍棋競賽規(guī)則(比賽結束時,后走棋的棋手貼目),是AlphaGo平時“訓練”使用的規(guī)則,而李世石則更熟悉韓式規(guī)則。除此之外,中國有句俗話叫“知己知彼,百戰(zhàn)不殆”,如今AlphaGo對于李世石肯定已經(jīng)非常“了解”,而李世石卻對AlphaGo一無所知,這對于李世石來說也是劣勢之一。
但尹英敏同時表示,AlphaGo的優(yōu)勢能否左右戰(zhàn)局,依舊取決于李世石當天的身體及精神狀態(tài)。
IT界觀點不一
作為人工智能界的專家,李承鎬的觀點與韓國近六成民眾一致:李世石會獲得壓倒性的優(yōu)勢。他認為,即便是機器人有其獨有的優(yōu)勢,依然無法對于狀態(tài)良好的李世石產生巨大威脅。他笑稱:“畢竟很少會有頂級的專業(yè)選手,連續(xù)好幾場出現(xiàn)致命失誤,除非他不愿意繼續(xù)對決下去?!?/p>
創(chuàng)新工場CEO、谷歌前全球副總裁兼大中華區(qū)總裁李開復也在知乎上表示,AlphaGo這次要打敗李世石比較懸,但是1~2年之內必然完勝人類。
李開復指出,樊麾只是職業(yè)二段,而李世石是職業(yè)九段,差別是巨大的,“就比如說一個人乒乓球打敗了非洲冠軍,并不代表他就可以成功挑戰(zhàn)中國冠軍?!?/p>
與上述觀點不同,搜狗CEO王小川認為,人工智能將會完勝。他提出了自己的兩個斷言:AlphaGo將會完勝李世石;除了圍棋,人工智能在其他博弈類的封閉游戲里也會橫掃人類?!拔艺J為谷歌的那套深度學習的方法加上搜索空間的方法,大體上可以覆蓋人的思考,而且它可能做得更好?!蓖跣〈ū硎尽?/p>
AlphaGo的研究者戴維·席爾瓦表示,AlphaGo系統(tǒng)的關鍵是,將圍棋巨大無比的搜索空間壓縮到可控的范圍之內。為了達到這一目的,AlphaGo系統(tǒng)將最先進的蒙特卡洛樹狀搜索技術與兩個深層神經(jīng)網(wǎng)絡相結合,每個深層神經(jīng)網(wǎng)絡均包含許多層,每層又包含數(shù)以百萬計的神經(jīng)元一樣的連接。
在AlphaGo兩種不同的神經(jīng)網(wǎng)絡中,“策略網(wǎng)絡”的作用是預測下一步,并用來將搜索范圍縮小至最有可能觸發(fā)的那些步驟;另一個神經(jīng)網(wǎng)絡“價值網(wǎng)絡”則是用來減少搜索樹的深度,每走一步估算一次獲勝方,而不是搜索所有結束棋局的途徑。
上述方法使得AlphaGo的搜索方式相比之前的方法更人性化。例如,深藍采用強力方法搜索的棋子位置要比AlphaGo多數(shù)千倍。而AlphaGo則相反,它通過想象下完剩余棋局來對下一步進行預判,如此多次反復。在上述模擬游戲中,策略網(wǎng)絡提出下一步的智能建議,而價值網(wǎng)絡則對走過的每個位置進行評估。
具體而言,谷歌首先采用圍棋專業(yè)棋手的3000萬步下法對“價值網(wǎng)絡”進行訓練,直到該網(wǎng)絡對人類下法預測準確率達到57%(AlphaGo之前的紀錄是44%)。
但AlphaGo的目標是擊敗水平最高的人類棋手,而不僅僅是模仿他們。為了做到這一點,AlphaGo學會自己發(fā)現(xiàn)新策略,通過自身兩個神經(jīng)網(wǎng)絡之間成千上萬的對弈,采用被稱為強化學習的試錯法逐步進行改善。這種方法提高了“策略網(wǎng)絡”的效率,以至于最原始的“神經(jīng)網(wǎng)絡”可以擊敗最尖端、構建有巨大無比的搜索樹的圍棋軟件。
“在與樊麾二段比賽后,我們對AlphaGo進行了多次更新。請大家關注AlphaGo以什么樣的方式與最優(yōu)秀的棋手李世石對弈?!惫_比斯昨日預計,“再過大約5年時間,AI將全面超越最頂尖人類棋手?!?/p>
最終贏家仍是人類
無論是AlphaGo還是李世石贏得比賽,這都不是人工智能的最終目的。
李承鎬一再向本報記者強調:“人工智能開發(fā)的最終方向,還是要取決于人類,并且服務于人類的。畢竟人工智能也是由人類制作而成的,這是人工智能技術發(fā)展的基礎和終極目的,我們不能忘記這個目的?!?/p>
“另外,通過人工智能技術,能夠促進IoT(物聯(lián)網(wǎng))等新技術的開發(fā),從而更有利于人類的發(fā)展與福祉?!崩畛墟€認為,近年來暫時停滯的科技發(fā)展,將因人工智能技術,煥發(fā)“全新的春天”。
谷歌董事長埃里克·施密特也在賽前發(fā)布會上表示:“我們開發(fā)人工智能機器人的最終目的在于為人類提供福祉,為未解難題提供新的解決方法;而其中,圍棋只是我們選擇增強人工智能機器人的實力的方法之一。無論這場對決孰勝孰負,最終的贏家都將是人類自己,因為人工智能的發(fā)展,最終的受益者將是人類自己。”
事實上,目前谷歌、百度都已經(jīng)通過人工智能技術在語音識別、圖片識別、無人駕駛等方面展開應用。
“當湖十局,不止求勝,在棋局之外,我們探求的新境界是人類智慧與機器智能的配合,因而圍棋智能僅僅是人工智能的副產品,而人工智能的終極目標是讓我們擁有更加便捷的生活?!碑悩嬛悄蹸EO吳韌說。