西洋棋、日本將棋、圍棋都精通了!制霸人類全新 AlphaZero 登上《科學》期刊

Photo Credit: DeepMind

去年度,DeepMind 打敗自己的紀錄, AlphaGo Zero 戰勝首個人類圍棋世界冠軍的程式 AlphaGo,當時在 Nature 這篇論文《Mastering the game of Go without human knowledge》(不使用人類知識制霸圍棋)引起 AI 界歡聲雷動。今日,DeepMind AlphaGo 幕後重要推手黃士傑博士又於臉書上宣布一項振奮人心的消息,新一代 AlphaZero 精通自學精通三種棋類,同時團隊也登上了《科學》期刊

根據 DeepMind 部落格,經過全面完整的評估 AlphaZero 被科學界授予更高的肯定,同時也整理 Alpha Zero 一路以來的戰績。

 AlphaGo Zero 在於無需任何人類指導,透過全新的強化學習方式,讓 AI 自己成為自己的老師,更在圍棋這項具挑戰性的領域超越人類水準,相比起之前使用人類對弈的數據,新的演算法訓練時間更短,當時僅用 3 天時間就達到了擊敗李世乭的 AlphaGo Lee 的水準,21 天就達到了之前擊敗柯潔的 AlphaGo Master 的水準。

先前 AlphaGo Zero 是針對圍棋所設計,目前新一代的 AlphaZero 透過強化學習的方式,再學會三種棋類遊戲:西洋棋(chess)、日本將棋(shogi)與圍棋(Go),AlphaZero 藉由強大運算能力-5,000 TPU 相當於一台非常大的超級電腦,很快就學會三種棋盤遊戲。不但打贏了前代 AlphaGo Zero ,在西洋棋甚至大幅超越過去頂尖的傳統西洋棋程式 Stockfish (1000 局的比數是155 勝 6 敗,而 Stockfish 遠超 1997 年戰勝世界冠軍 IBM 的 Deep Blue 深藍)。

從電腦時代開始以來,包括 Babbage,Turing,Shannon 等早期開發者都曾試圖設計西洋棋程式, AlphaZero 突破人工智慧一直以來面臨的巨大挑戰。AlphaZero 在人類棋史上寫下嶄新的一頁,就連世界西洋棋冠軍加里卡斯帕羅夫對這樣顛覆人類智慧的 AlphaZero 讚,然而 AlphaZero 不單只是讓增加了幾個世紀來玩家對西洋棋、日本將棋、圍棋戰略的思考模式,對人工智慧發展更是新里程碑,更為解決現實問題的智慧系統打下基石。

延伸閱讀: