“圍棋上帝”AlphaGo 人類棋手難有勝算

第A11版：經濟

放大+ 缩小- 默认o

“圍棋上帝”AlphaGo 人類棋手難有勝算

人工智能的研發經過多年的低谷期後，在一九九七年出現了大反轉，當年IBM的超級電腦“深藍”(Deep Blue) 在國際象棋比賽中擊敗了世界國際象棋冠軍卡斯帕羅夫，標誌着電腦在複雜的思維任務中取得突破性進展。

在一九五○年代的所謂“狹義人工智能時代”，專家和研究者通過手工編程將大量知識和規則嵌入計算機，以進行對特定領域問題解決和推理。在這個時期電腦的“智能”理論上是無法超越其製作程式和輸入知識的專家，但它的長處是可以快速地、準確地處理大量資料和數據，節省大量的人力工作。

深度學習獲巨大突破

廿一世紀初至今，AI被認為進入機器學習(Machine Learning) 時代。在一九八○年代末至一九九○年代，機器學習已開始受到廣泛關注。支持向量機(SVM) 和決策樹等算法出現，為模式識別和預測性分析提供了強大工具。深度學習(Deep Learning) 隨後更取得巨大突破，例如卷積神經網絡(CNN)和循環神經網絡(RNN)等模仿人類的結構，在圖像識別、語音識別、自然語言處理等領域實現了驚人表現。

強化學習(Reinforcement Learning) 是機器學習中的一個子領域，在近10年也取得重大進展。它主要是研發如何使一個智能體(Agent)在與環境互動過程中，通過試錯來優化其行動策略，從而使智能體自動調整出最佳策略，以實現在特定任務中的最佳表現。通過強化學習，智能體只要不斷地收到信息，電腦就可以廿四小時全天候自我優化學習，因此在“智能”上超越人類就成為可能，起碼在某些特定領域方面。

阿法狗智力壓倒人類

二○一六年三月，韓國職業九段圍棋手李世石與谷歌開發的電腦圍棋軟件AlphaGo(阿法狗) 舉行比賽。圍棋是一個高度複雜的策略遊戲，規則雖然簡單，但每一步卻可能引發不同的連鎖反應，要求玩家必須具備深刻的直覺、戰略思維，並同時考慮對手的反應，因此賽前不少評論員認為電腦勝算不大。AlphaGo最後以四比一戰勝李世石，賽後韓國棋院並授予AlphaGo為榮譽九段。

二○一七年五月，中國棋王、當年世界圍棋排名第一的柯潔再出戰AlphaGo，結果以○比三完敗，代表人類所創造的機器可以在智力上壓倒人類。當時年僅19歲的柯潔，在賽後的發佈會上一度說到哽咽，認為AlphaGo的表現已經像他理解的“圍棋上帝”，再三強調對手的完美，自言輸到沒有脾氣。

事實上，AlphaGo不僅完勝柯潔，其下棋所需要“考慮”的時間只是柯潔的1/3。圍棋棋盤由19×19個交叉點組成，玩法組合的數目非常驚人，高達10^170次方，其數字幾乎超過宇宙中粒子的數量，傳統方法無法計算窮盡，電腦雖然仍無法計算出全部可能的組合，但顯然比人類具有更多的優勢。

AlphaGo的設計主要基於在蒙特卡洛樹(Monte Carlo Tree) 上進行優化。據說AlphaGo被輸入了三千萬個人類對弈的棋譜，然後通過統計，大概能知道每個棋局狀態中走哪一步勝算更高。根據得到的統計概率結果，AlphaGo再繼續不停下局，優先選擇統計出來勝算高的下法，通過試錯而進行自我糾正。隨着下的局數越來越多，統計結果越來越接近真實，棋藝自然越來越高。

AI技術實現三大要求

蒙特卡洛樹(Monte Carlo Tree) 是一種以概率統計理論為指導的傳統數值計算方法，早在一九四○年代就提出。但直至二○一二年，它才能夠為深度學習(Deep Learning) 有效運用並實現突破性發展，AI技術實現了三大要求：一、必須有大量資料可供輸入；二、計算機具備強大和高速運算能力；三、簡單好用的軟體。“深藍”和“阿法狗”只是機器學習時代一個成功的強化學習案例，如今AI的發展和突破已進入人類生活的各方面。

容永剛

放大+ 缩小- 默认o