2017年8月12日 星期六

從AlphaGo談圍棋的未來(5)



股溝的次一手

大橋:
另外阿發夠開發團隊並不會解散這件事讓人很開心。

王:
不過另一方面阿發夠還是有要退休的報導傳出來。

大橋:
在新聞上看到的內容和現場聽到的講法,氣氛上多少有些不一樣。現場有中文、英文,還參雜著同步翻譯的日語....。我自己對於聽到的解釋是,所謂的退休,只是指不再和人類比賽而已,在圍棋上的研究照理說還是會稍微持續下去才對。

孔:
其實我也是做同樣的解釋。就不再參加比賽這件事來看也許算是退休,但在普及上發揮、或是改下配對賽,不就等於還要繼續發展下去嗎?

王:
那意思是說阿發夠的自我學習是直到現在還在進行嗎?因為一般的報導可就沒有寫到這方面的訊息了。

大橋:
哈薩比斯先生倒是說了後續會把阿發夠到底在思考甚麼,做成人類可以看的懂的形式來發表。就我在現場聽到的講法而言,其意義就只是把這次所下的五局中阿發夠在想甚麼表示出來。但在報導中卻是往更寬廣的方向延伸成要開發出可以解釋阿發夠的想法或是下出的棋的工具。如果真是這樣的話,比起圍棋AI強於人類,能做出把電腦想法說明出來的工具,對整體圍棋界來說是更具有「社會性」意義的重要工作吧?希望股溝能夠明確表達出他們的目標。

王:
圍棋AI到底在想甚麼的這種工具,我覺得是一定要做的。光是能看到其資料、算路就很夠了。我想要讓我們看到其內容這件事本身並不會很困難才對。哈薩比斯先生也說將來希望也能把人腦做成可視化。其目標既然是把人類的腦海做成可視化,相比起來把阿發夠的思考做成可視化就簡單多了吧。

孔:
我聽說哈薩比斯先生認為要把全部的變化圖都顯示出來的話,其資料量太過龐大,所以是不可能的。就職業棋士而言,變化圖當然是越多越好,自然希望能夠全部公開。不過,根據不同的局面,是要顯示出勝率?還是顯示出變化圖?或者要顯示到甚麼程度?目前也都還是未定的。我們職業棋士對於複雜的計算比較擅長,所以如果有很多資訊可以看的話,當然希望能夠看到全部的內容才是。

王:
他們應該是一點一點漸漸公開出來才對。如果能夠做到將阿發夠的思考內容做成可視化的話,也許還會做成可以將此技術應用到各種地方的泛用型工具吧?

大橋:
現在深度學習雖然可以活用到各種領域上,但AI是怎麼思考、又是怎麼做出結論,恐怕就連程式開發者自己都不知道。現狀是去做實驗來看,也只是偶爾會看得出來而已。我想哈薩比斯就是想藉著圍棋,找出將AI思考可視化的方法才對。

王:
沒錯。現在就是只知其「結果」而不知其「過程」。所以既然現在他們也想讓大家看到「過程」,可見他們也是充滿幹勁呢。

大橋:
好比說,在阿發夠自我對戰的棋譜中,有好多局都會出現三連星的佈局(F圖)。至今為止,我們都認為下出三連星後,棋路的走向就會變成相當意識中央才對。然而阿發夠卻用黑1直接進三三。至於為何它會跳出這樣的「結果」?其「過程」就讓我非常好奇。

F圖 阿發夠的自我對戰譜


王:
這應該是把下出來的三連星當作強大背景,因此想要遠離這個強大勢力,就會變成直接進三三了吧。感覺起來這有點想要從下把星位之子往上托高啊(笑)。

孔:
哈哈哈。「托高」是嗎?哎呀,它應該是認為三三是最容易獲勝才這樣下,這應該是沒錯的吧?

大橋:
當棋盤擴大到21路時,它的想法也可能會變成掛角吧?(笑)

王:
不管是甚麼想法,使用圍棋這種工具,正好可以展示深度學習的強大性能,如果能夠再能把AI的思考內容表示出來的話,對圍棋界來說,是非常光榮的一件事啊。

孔:
圍棋AI思考的預測圖變化數,就像樹狀圖那樣會分成很多枝,但聽說阿發夠的樹狀圖分枝是相當少的。西洋棋「深藍」聽說一秒鐘可以算兩億手,但阿發夠才僅僅一萬手。雖然它只去算一萬手,但其細算內容的品質卻是非常之高。

王:
這應該就是所謂的策略網路所造成的效果吧。

大橋:
在第二天所舉辦的研討會中,希爾維先生也說過,當策略網路與價值網路這兩種網路互相強化之後,其性能會更加飛躍性地成長。

孔:
就我而言,好比說就算是知道了阿發夠是怎麼思考的,我們是否能真正理解,也是很有疑問的。這個部分在阿發夠開發團隊中非常懂圍棋的黃士傑博士或樊麾先生身上也能看到,因為就連他們也無法完全理解阿發夠所展示出來的棋。雖然我們想看阿發夠思考內容的願望非常強烈,但看了之後真的看得懂嗎?也是最真實的心情。

王:
直覺上多少要能體會其內容,不也就是我們職業棋士的工作嗎?

孔:
但真的能看懂嗎....?(笑)

===



相關系列文章: