新聞 > 體育 > 正文

深度:李世石神之一手如何逼機器失誤

就在輿論普遍認為「人類代表」李世石將會繼續敗給阿爾法狗(AlphaGo)的時候,今天,圍棋人機大戰的第四局,李世石中盤發力,在第78手巧妙落子,出人意料地挽回了敗局,將比分改寫為「3:1」,雖然總體的勝負已無法逆轉,但李世石扳回一城的勝利對人類來說可謂意義非凡。

北京時間3月13日,李世石與谷歌圍棋AlphaGo(阿爾法圍棋)人機五局大戰第四局,繼續在韓國漢城鍾路區四季酒店進行。李世石在前三局比賽中0-3落後,實際已經提前宣告失利。按照雙方賽前的約定,隨後兩局對局照常舉行。

3月15日12:00(韓國時間13:00),雙方最後一局比賽將在同一場地如期開戰。

比賽開局階段,李世石始終落後於AlphaGo,一直在被吊打。然而,第78手的時候,局勢峰迴路轉,李世石在苦思25分鐘後下出了關鍵的一步,一招極其冷門的妙手。對於這一步棋,視頻觀戰的職業棋手、中國圍棋冠軍古力評價為「神之一手」。

隨後,AlphaGo應對適當,一連串的差手讓棋面局勢利多於李世石。在第97步,AlphaGo再次出現低級失誤,所下黑子被李世石果斷吃掉,此時李世石已基本鎖定勝局。

此後AlphaGo四處攪局,李世石不為所動。

最終,經過長達4個多小時的鏖戰之後,李世石下出第180手,連續三步占優,AlphaGo中盤棄子認輸,首嘗敗績,李世石終於在這場人機大戰中贏回「尊嚴」之戰。

終局時的棋盤

對於戲劇性的比賽結果,網絡上出現了有多種觀點看法,其中最有代表性的一種說法是「AlphaGo選擇性放水「。甚至還有陰謀論表示,AlphaGo今天失利是因為被改代碼。那麼,AlphaGo放水的可能性有多大呢?

雷鋒網採訪圍棋界、科學界的專業人士,對於放水說法,他們都表示,「可能性為零」。至於李世石第78步的落子,完全可以稱得上是載入史冊的一次妙招!

業餘圍棋5段的高飛龍表示:李世石創造了歷史,第78步棋沒有一定水平看都看不懂,很高的職業水準才能想得到。

棋手鮑雲對於李世石第78步下法給予了很高的評價:「配得上最高評價神之一手。」

AlphaGo程序在大優局面的情況下被李世石的妙手打懵了,導致在隨後的20來步進入瘋狗狀態。

鮑雲表示:「AlphaGo前半盤大優,不是放水的態度。至於AlphaGo第97步的表現可以用「瘋狗病發作」來形容。78-97步,機器應該有足夠的(時間來)緩衝調整計算出局面走勢。97確實是很「丟狗」的一步,說明算法還是有極大的問題,抗擊打能力不足,崩潰的太脆了」。

那麼,AlphaGo為何會出現如此明顯的異常表現?

根據谷歌DeepMind創始人、Alphago原論文第一作者之一的戴密斯·哈薩比斯(Demis Hassabis)在賽後發布會上說,「衷心祝賀李世石獲勝,讓我們看到他是多麼偉大的棋手。看AlphaGo的統計,也知道形勢的變化。李世石下得非常好,給AlphaGo製造了失誤。我們也非常高興,在韓國舉行這個比賽,也是為了看看AlphaGo實力,測試極限、改善提高他,也需要李世石這樣優秀的天才棋手。李世石今天下得非常精彩。」

隨後,哈薩比斯還在推特上發布了總結,「李世石下出白78後,AlphaGo自我感覺良好,在程序的『值網絡』(用於評估電腦勝率)中,誤以為勝率達到70%,在第79手犯了錯,直到第87手才反應過來它錯了。」

AlphaGo的開發者哈薩比斯發布的twitter

AlphaGo另一創造者大衛·席爾瓦(David Silver)指出,李世石的神之一手,點中計算機此前不為人知的漏洞。他說:「AlphaGo是自我對局來進行學習,這樣有可能會存在缺陷。我們不是職業棋手,正需要進行這場比賽,希望能尋找到這樣的缺陷,發現AlphaGo的極限。今天在棋盤中央就看到了,李世石下得非常漂亮,我們希望能促進AlphaGo的進步。期待周二的第五局比賽。」

專家表示,AlphaGo的弱點,可能是在極為複雜的局面,計算存在誤區及盲點,當遇到無法想像的問題時,可能會按照人工智慧的本能處理,做出奇奇怪怪的舉動。

高飛龍猜測,很可能是蒙特卡洛算法本身的一個缺陷。「78步本身是盲點,(李世石)小概率的選點,很可能導致(AlphaGo)在正確率很高的算法上出現意外事件,導致出錯。」如果這一猜測成立,人類將可能找到每盤打敗阿爾法的策略。而谷歌公司,將需要很長的時間來修正這一「缺陷」問題。

在賽後的記者招待會上,李世石則談到了AlphaGo的兩個弱點:一個是AlphaGo執黑棋時似乎掙扎比較多,相較執白棋時更難贏。另一個是,當它遇到出其不意的招數時,有可能會導致失誤,未必是失誤,就是bug。

一直低調、板著臉的李世石走進發布會場聽到在場記者的掌聲與歡呼聲時終於露出了笑容,說出的第一句話就是感謝:「謝謝大家,我第一次因為獲勝受到如此祝賀。今天能贏,我非常開心。非常感謝大家,只贏了一盤,不需要這麼隆重祝賀的。」

當被問到為何在78手使出「神之一手時」,李世石坦言,這是在當時那種情況下,他唯一能走的一步棋。

「因為我前面已經輸了3場,所以我的壓力沒有這麼大。這場勝利對我來說很重要,但如果沒有大家的支持,我今天也贏不了。」李世石坦言,放下了勝負的包袱,輕裝上陣確實對良好的發揮起了作用。

李世石同時向DeepMind詢問,「這局執白獲勝,下一局能否不猜先,讓我執黑,這樣獲勝更有意義?」哈薩比斯和席爾瓦均表示同意。

此前有專業棋手稱李世石仍過於保守,並未施展出擅長的狠辣棋風。今日的人機大戰第四局戰至中盤,壓力大減的李世石乭終於勇敢反擊,打入黑棋廝殺。當他苦思25分鐘打出第78手後,觀戰棋手紛紛驚呼喝采,視之為極為勇悍的妙著。

今天的第四局比賽,李世石執白終於戰勝「阿爾法圍棋」,為人類也更為他自己贏得一局可以保留顏面的勝利。

那麼最後的懸念來了,兩天後的第五局比賽,是李世石再下一城還是AlphaGo4:1榮耀收官?

責任編輯: 於飛  來源:觀察者 轉載請註明作者、出處並保持完整。

本文網址:https://tw.aboluowang.com/2016/0314/707608.html