日本人工智能DeepzenGo要么墊底,要么奪冠

記者謝銳報道 3月21日,人工智能和人類平等競技的“世界圍棋精英賽”將在日本大阪打響。日本開發(fā)的圍棋人工智能程序DeepZenGo將與中日韓三國頂尖高手進(jìn)行人機(jī)大戰(zhàn),參賽的三國棋手分別是:中國棋手等級分第3的羋昱廷九段、日本六冠王井山裕太九段和連續(xù)40個月占據(jù)韓國棋院排名榜首的樸廷桓九段。
2016年3月谷歌“阿爾法狗”對李世石九段4比1大勝、一戰(zhàn)成名后,人工智能何時再與人類高手進(jìn)行對抗尚在策劃中,但倍感意外的是一向以思想保守、行動遲緩著稱的日本棋界竟然捷足先登,首先于2016年底舉辦了一場趙治勛九段對DeepZengo的三番棋大戰(zhàn),趙治勛2比1艱難取勝;隨后更是宣布于2017年3月舉行為DeepZengo量身打造的“世界圍棋精英賽”,將DeepZengo視作與世界一流高手等列的精英地位,冠亞獎金分別高達(dá)3000萬、1000萬日元,這正好是8年前日本主辦的豐田杯世界圍棋大賽冠軍獎金數(shù)額,也相當(dāng)于當(dāng)今三星杯、LG杯、百靈杯、Mlily夢百合杯冠軍獎金額。
但相比32強(qiáng)參賽、總共要進(jìn)行5輪比賽爭奪的幾大世界圍棋公開賽,僅有4位參賽者的“世界圍棋精英賽”獎金實在豐厚。
此次比賽賽制為循環(huán)賽,DeepZenGo和中日韓頂尖棋手進(jìn)行單循環(huán)賽,同分則加賽爭冠,這場比賽最大的看點(diǎn)在于:DeepZenGo最終排名第幾。從2016年12月29日至2017年2月15日,DeepZenGo在弈城網(wǎng)每天24小時不眠不休共下了49天的測試對局。總局?jǐn)?shù)為1622局,勝1316局、負(fù)306局,勝率達(dá)到81.1%。其中對職業(yè)棋手615勝250負(fù),勝率71.9%,對業(yè)余強(qiáng)豪701勝66負(fù),勝率91.4%。
從超過千局的對弈結(jié)果來看,DeepZenGo對業(yè)余棋手幾乎可以保證勝利,在弈城舉行的特別十盤棋對抗賽中,Deepzengo對10個最高水平的業(yè)余高手只輸了2局。對一般職業(yè)棋手勝率尚可,但也經(jīng)常輸。對一線高手是輸面大,雖然有時也能勝。頂尖高手層面中,僅有陳耀燁九段、連笑八段等極少數(shù)棋手與其交過手,因此不足以反映出其真是水準(zhǔn)。
DeepZenGo要達(dá)到谷歌Alphago和騰訊絕藝這樣的水平,必須在瓶頸上取得突破,但有專家在網(wǎng)上寫道,其開發(fā)歷程過去是人工寫搜索代碼、植入圍棋開局與棋形知識,此開發(fā)風(fēng)格不易轉(zhuǎn)型到靠多個服務(wù)器暴力機(jī)器學(xué)習(xí)強(qiáng)化學(xué)習(xí)的路線上來。將策略網(wǎng)強(qiáng)、價值網(wǎng)絡(luò)等先進(jìn)武器加進(jìn)來后,Zen的實力提升很快。但之后再要提升,之前的代碼反而變成拖累。
臨開賽前一段時間,DeepZenGo還在網(wǎng)上大量練手,只是找不到柯潔九段這等級別的高手與之對弈。在這段時間里,DeepZenGo要么取得突破,與Alphago、絕藝一樣與頂尖高手平起平坐,甚至還要高出一籌;要么原地踏步,在一流棋手與超一流棋手之間徘徊。
中日韓三位參賽棋手之間戰(zhàn)績分別是,羋昱廷對樸廷桓2勝4負(fù),對井山裕太1負(fù),樸廷桓對井山裕太的戰(zhàn)績是2勝2負(fù)。因比賽每方用時多達(dá)3小時,如果Deepzengo仍無突破的話,這個比賽用時對人類有利,Deepzengo排名墊底的可能性更大。