專訪九段棋士王銘琬:AlphaGo,為人類對抗 AI 的時代正式畫下句點

「一字一句,皆充滿獨特哲理。」是我們這次採訪王銘琬九段最大的感想。

如果你要問地球上誰能同時以「圍棋」與「AI 開發團隊」兩種視角深入理解 AlphaGo,一口氣拿下第 55、56 期本因坊,也是投入圍棋軟體開發職業棋士第一人的他,絕對是箇中翹楚。但他的棋風、棋涯乃至於棋理,跟很多高段的職業棋士很不一樣,他並沒有固定的師承派流,讓他棋風獨樹一格,悠遊自在而享「銘琬世界」之美譽;同時在生涯與心態上,他反而也不追求如柯潔、李世乭等明星選手那般「早日登頂」,而是以自己的獨特步調前進,直到近四十歲終獲本因坊寶座。

他曾在這次推出的新書上說過,希望無論是多重要的比賽,每次下棋都能以「童心」享受樂趣。這讓他帶給人一種很獨特的價值觀:不能說不追求棋盤上勝負,可是所看重的東西卻是更廣、更遠,也是更自在的。他曾自嘲自己追求每一步棋「概率」的想法與正統相比是邪道,但正是這種「把圍棋看作無限,不追求唯一正解」的思維跟蒙地卡羅法一拍即合,從此積極投入圍棋軟體開發。

在這篇文章裡,INSIDE 將綜合 6 月 18 日新書發表會的採訪內容與本次深度訪談,跟讀者們分享王銘琬眼中所看到人工智慧與圍棋的共同未來。

AlphaGo 三個階段中,就屬「李世乭戰」最值得人類學習

INSIDE 在先前的文章中就認為解說 AlphaGo 跟李世乭一戰是王銘琬新書最精彩的部分之一。那麼從棋藝的技術層面上來看,王銘琬認為 AlphaGo 有哪些地方最值得人類棋士學習呢?也正好就在李世乭一戰裡。「李世乭版的 AlphaGo 無論從計算能力、棋力,都是跟人類(頂尖棋士)最接近的,在這個版本中,人類有些不敢下的棋步,AlphaGo 卻能發揮得淋漓盡致,因此看那時的棋譜,對人類自己也有最用。」

不過意外的是,現在 Master 版值得人類學習的價值卻未如當初。「當然後來跟柯潔對戰的 Master 還是有值得學習的地方,但它已經超越人類能力太多,暫時還跟不上。我們可以拿棒球技術來譬喻,AlphaGo 是身體能力 100 公尺跑 12 秒內的棒球選手,我們跟他差異沒那麼大,所以可以在他身上學到棒球技術,但 Master 的身體能力已經可以跑進八秒內了,這時候它棒球打得雖然更好,但那已是大幅超越人類肉體極限的表現。」至於 Google 事後公布那 Master 五十盤的自我對弈棋譜,王銘琬則是覺得參考價值就不高了。「自我對局其實本來就是怪現象,說到底圍棋就是不同人彼此個性的較量,就像波長不一樣的浪才會激起浪花。

AlphaGo 所塑造的人機新關係

在這次烏鎮峰會後,DeepMind 宣布 AlphaGo 不再參加像與柯潔、李世乭比賽的正式公開戰,這在王銘琬眼裡,形同已為人對抗 AI 的時代畫下句點。他在書中有點悲觀地提到,「如果不改造 DNA,人類是無法進步到圍棋 AI 般的整體能力。」

「從此以後人類棋士不會覺得自己一定要跟電腦比高下,下輸電腦也不再是丟臉的事。」而且對 Google 自己來說既然已到達超越人類的目標,接下來該做的,反而是極力降低人機對抗的色彩。「AI 企業最怕的事情,就是大眾把 AI 當作他們的敵人」王銘琬說道,所以 DeepMind CEO 哈薩比斯才會不斷一再強調 AlphaGo 是作為人類認識圍棋的一種工具這種論調,王銘琬本人也頗為認同這個想法。

但 AlphaGo 還是狠狠衝擊著職業棋士們。有人會問不久將來棋力高強的 AI 就會商品化滿街跑,那職業棋士還有存在的意義嗎?當然從西洋棋的例子來看,職業棋士是不會消失的,但他們已從那「下出圍棋史上最好的棋」的夢想,轉化為「下出自己史上代表作」了 。頂點已經出現,接下來棋士反而該做的,是以自己棋步更積極尋求其他下棋人的「共鳴」。

不過他也認為,一般大眾倒不需為人工智慧時代來臨太過恐慌。雖然 AI 在很多能力已大幅超越人類了,而且 AI 跟人類是完全不一樣的個體,人會因認知偏差,覺得人工智慧只要表現稍有偏差,稍微不聽人話就感到恐懼。「哈薩比斯自己也推動成立 AI 倫理委員會,讓人類可以隨時監視它;但現在人類對深度學習不可理解的程度,並不會超過我們對『其他人』不理解的程度。」換句話說,很多時候人本身才是比 AI 更大的不確定因素,與其擔心 AI 自己會作怪,還不如擔心人怎麼濫用 AI。

水平線效果的再反思

我們在前一篇文提到,就連 AlphaGo 也未能克服「水平線效果」這 AI 與生俱來的弱點。這個效果意指因程式對於「自己搜尋深度以上」的問題無法判斷,以至於作出從長期觀點而言會有不良影響的決定,在對上李世乭第四戰那唯一一場敗績中,AlphaGo 就出現了這種現象,得知自己勝率不高後反而下出了一些期待對方「超低級錯誤」的棋步,是棋力很低的人才走得出的招式。

這一直到新版的 Master 都還在發生,不只烏鎮的人機配對戰也「扯後腿」亂下棋逼迫隊友不得不投降,王銘琬觀察那五十盤的 AlphaGo 自我對弈棋譜也普遍存在相同現象。在書裡他以棋士專業角度跟讀者們詳細解說神之一手後 AlphaGo 的決策過程,也以為圍棋軟體開發者身份告訴大家水平線效果的潛在弱點。

但在這次面對面參訪裡,他倒是請大家不用特別看待這個現象;顧名思義,水平線效果就是指超乎視野極限的存在,他解釋這是圍棋軟體把邏輯設計成「以贏為前提」而忽略目數差距的效果。人類棋手可能會追求輸得少一點、好看一點,但 AI 沒有這種概念,如果程式設計越硬性,規定越多,這種效果就會變得更明顯。甚至也反過來說:「AI 會故意不碰他不懂的東西,但是不是人類其實更常去規避自己所不懂之物呢?」

一次 Google 對 TPU 的火力展示

相信有不少讀者都很清楚這次 AlphaGo 大戰柯潔,其實也是一次 Google 秀 TPU 的火力展示。TPU 是專為機器學習打造的晶片,運作所需的電晶體較少,因此每秒可在矽單元上塞進更多處理程序,而且還比 GPU 更加節能。僅僅一年 AlphaGo 棋力就能提升三子之多,其背後不僅只靠更強的演算法,硬體上也採用了 4 塊第二代 Cloud TPU 組成單機,不僅更節能,運算能力甚至高達之前李世乭版的 10 倍。

王銘琬當然也察覺到這點。由於 AlphaGo 對戰李世乭獲得空前成功,他個人很佩服 Google 有勇氣把整間公司極大成本都賭在了開發人工智慧與 TPU 上。所以從去年開始,整間 Google 都一直在喊將從 Mobile First 走向 AI First,幾乎在所有重要產品都可以看到 AI 應用的蹤跡,也開啟了科技業準備進入 AI 軟硬體都是空前大決戰的時代。

AlphaGo 也讓日本深感自己 AI 開發能力不足

AlphaGo 不僅驚動世人,也為原本就不大的圍棋開發圈投下一顆震撼彈。自 AlphaGo 以後深度學習蔚然成為為其軟體主流。王銘琬解釋,隨著運算能力與演算法的進化,圍棋軟體的水平也與開發者自己棋力完全脫鉤。「在深藍那個時代,棋藝軟體水平絕對取決於開發者本身的棋力,但到了蒙地卡羅,所有軟體都已經比開發者本人強了。現在深度學習時代更不用說,軟體強弱完全已跟開發者棋力完全無關。

關於這點,他本人也有很深的體悟。早在 2015 年,他與趨勢開發團隊就已經知道 Google 跟 Facebook 正試圖將深度學習運用在圍棋軟體裡,趨勢科技的開發人員也問過他要不要試一試。但他當時並未去想深入了解技術,只想讓自己獨特的棋步「空壓法」被寫進軟體裡而拒絕這項要求,可說是本書最大,也是最深沈的自我反省。

除此之外,AlphaGo 與後續的圍棋軟體也讓日本開發者深深體會到,他們在深度學習上已晚了其他人一大步。就拿日本老牌 AI「DeepZenGo」來說,它的前身叫「Zen」,棋力可達業餘初段而且已經引領圍棋軟體好幾年了。但在 AlphaGo 橫空出世後即導入深度學習改名成 DeepZenGo,以打倒 AlphaGo 為目標。但在今年三月,卻二連敗輸給了騰訊完全按照 Deepmind 開發路徑的新軟體「絕藝」,讓出世界第二的寶座。王銘琬說明 DeepZenGo 會輸絕藝並不意外,雖說 DeepZenGo 也有取得戰勝井山裕太九段的佳績,但實際上開發團隊不僅少得可憐只有兩人,而且它的硬體無法提供足夠的自我訓練能力,差了 AlphaGo 或絕藝一大截。

教育是 AI 與圍棋的新共通點之一

在訪談中,我們也跟王銘琬聊到了圍棋教育話題,正好也是 AI 能為圍棋界創造新可能性的選項之一。王銘琬首先說明台、日、韓三個國家中,就屬台灣的圍棋教育最廣泛卻也最理想。他解釋,4、5 歲就讓小朋友開始學棋,讓他的棋感跟直覺一起培養會最有效果。但在日本或韓國,家長讓小朋友學棋的動機往往一開始就是瞄準讓他成為職業棋士了,反而讓學棋人數逐年降低。「所以台灣把圍棋當作一種興趣或才藝,反而才是最正確的培養方式。」王銘琬說。

但在棋力強大的人工智慧大量商業化後,這個狀況可能將大幅改變。一來自學的門檻變低了,可能會改變日本或韓國傳統的圍棋教育結構,進一步再壓低學棋的平均年齡;二來也能讓大多數人藉由軟體模擬像柯潔等棋風的方式,享受與強者對陣的樂趣。

而這也將是王銘琬跟趨勢重啟合作的重點,接下來 GoTrend 將會以協助人類作為開發新方向。「我認為經過柯潔這一仗之後,強不強已經不再是圍棋軟體所追求的重點,而是怎麼幫助人類重新獲得樂趣;圍棋單純追求勝負的時代也過去了,它應重新成為人們互相溝通的工具。」

這篇文章 專訪九段棋士王銘琬:AlphaGo,為人類對抗 AI 的時代正式畫下句點 最早出現於 INSIDE 硬塞的網路趨勢觀察