2017年8月9日 星期三

從AlphaGo談圍棋的未來(2)


大橋:
其探索著手的深度,換句話說,就是人類所說的「細算」變強了,因此開始下出符合其判斷力的強力著手,也許也是這樣才會導致到它開始直接進三三吧?本來我已經開始想像阿發夠終於下的會是最佳手段了;但我現在得理解成、也必須去解釋成這是隨著版本的變更、細算的深度也會改變,對嗎?

王:
沒錯。根據細算的深度不同,著手也會變更是理所當然之事。

大橋:
換句話說,也是因為阿發夠與人類的細算差距很大,光是模仿它的著手是無法學得像、也學不好的。

孔:
以我自己的棋力而言,完全不會想要去追上阿發夠,也不會想去找出它的弱點。單純就是佩服、想要鑑賞它的棋譜而已。只不過,我會試著跟自己說不要完全相信阿發夠的著手。

大橋:
如果去問熱心追逐圍棋AI消息的業餘棋迷之意見,他們會說在阿發夠、絕藝與店長之中,店長是最容易模仿,甚至希望拿來當下棋的範本的。至於阿發夠的話,他們也跟孔令文先生所說的一樣,純觀賞就好。

孔:
特別是阿發夠的自我對戰棋譜,完全只能當作鑑賞用,根本不會有想要去研究的心情了(笑)。說到這裡,大橋先生在現場進行對局解說時,曾經說過:「我覺得圍棋並不是用來脫先的遊戲」這個大橋先生一向的主張,這讓我印象深刻。看了這次的對決之後,頗讓我有恍然大悟的感覺。

王:
我本來就覺得圍棋是一種雙方互相試探狀況(問應手)的遊戲。當對手站在試探的位置上下出著手時,我方卻從接應的位置上脫離,就只能稱作是「脫先」了。相反地,我方是跑去別的地方站上試探的位置。就這樣的意義來看,脫先就是一種能夠理解的手法。從這樣的觀點來看,看到「脫先」的手法時,多少就能理解阿發夠的著手了吧?只不過,阿發夠看到的資訊量(著手變化)和我們看到的不一樣,所以我們就無法看懂它的棋是不是在試探了(笑)。

大橋:
的確,從阿發夠的自我對戰棋譜中就會看到它一直互相問應手、互相脫先,然後最後就變成互相糾纏的複雜局面了。我就有這樣的印象。

孔:
說到柯潔的三局賽,我就會想到第二局中的C圖之白1衝出。結果阿發夠不管這個找劫材的行動,反而是在黑4貼出,這讓我很佩服。特別是這種以往感覺沒有的下法,真的讓人很驚訝。

C圖 第二局 黑阿發夠 白柯潔


王:
我覺得這也和雙方掌握的資訊量有關。對我們人類而言,交換是件非常嚴重的事情。所以會需要考慮種種變化,也很難做出判斷。所以我們會盡量希望不要選擇交換。然而,這些對阿發夠而言,都是很簡單的。

大橋:
我覺得這其中也跟有無恐怖感有關吧。我覺得恐怖感這種東西對於人類的進化而言是非常重要的因素。這是一種從原始時代開始就有、不要被猛獸侵襲的「恐怖感」在推動人類的進化。就算是圍棋,這種恐怖感的控制也非常重要。因為有恐怖感,就不會下出有風險的棋,也下不出來。然而,對於圍棋AI而言,這些都是理所當然之事,就不會有恐怖感,而就可以放心的脫先。

王:
因為是圍棋AI,沒有各種心理感覺也是必然的,就算有,阿發夠下的棋也都有龐大的數值(勝率模擬值)、資訊量做後盾,所以也不會產生「恐怖感」吧?

大橋:
店長開發團隊的加藤英樹先生常常這樣說,以前的圍棋AI對於細算非常不擅長。而AI自己也知道自己的弱點,所以盡量會下出棋子與棋子聯絡在一起那樣的厚棋。這用人類來類比的話,也許就是一種恐怖感了。但阿發夠自從變得很會算之後,這種棋子與棋子互相聯絡的棋就變少了。

王:
的確。

孔:
我也覺得人類要向阿發夠學習進化的話,克服恐怖感是非常重要的一件事。

王:
不過,要做到克服恐怖感,還是需要相當的能力,以圍棋AI來說,就是要有數值做後盾。如果有輔助計算機則另當別論,但現在的人類的「硬體架構」是否還有提升能力的機會嗎?

孔:
我雖然不覺得人類的「硬體」、也就是腦力會比最新的圍棋AI差,但該怎麼好好使用就是非常困難的地方。畢竟一下子就把一大堆東西忘光光了(笑)。

===



相關系列文章: