本自同根生,相煎就是這么急。
在結束的世界人工智能圍棋大賽上,騰訊AI Lab開發(fā)的“絕藝”意外輸給了Phoenix Go,屈居第二。
Phoenix Go是微信翻譯團隊開發(fā)的人工智能圍棋,算是“絕藝”的小弟,它們兩個都出自騰訊,可謂“同根生”。
不同的是,Phoenix Go的優(yōu)勢在于,它基于AlphaGo Zero論文實現(xiàn),同時做了若干提高訓練效率的創(chuàng)新,并利用微信服務器的閑時計算資源進行自我對弈。
目前,PhoenixGo已經(jīng)戰(zhàn)勝過200多位人類棋手,這次戰(zhàn)勝“絕藝”倒是出乎所有人的意外。
認識PhoenixGo:曾被認為是百度、阿里、Zero養(yǎng)的“金毛”
2018年初,PhoenixGo以Bensondarr等賬號在騰訊野狐圍棋上進行實戰(zhàn),目前已經(jīng)戰(zhàn)勝200多位棋手。
在公布正式身份之前,社區(qū)、貼吧等上面關于BensonDarr的猜測眾多。
有的說BensonDarr的首字母縮寫是“BD”,就是百度的狗,也有的注意到BensonDarr從來沒有和絕藝指導下過棋,這很難解釋。正常的話,其它AI應該都是非常渴望挑戰(zhàn)絕藝,因此可能是阿里的狗。
看到Bensondarr這么強大,也有人說是Zero。
而Bensondarr換了金毛的頭像后,就被棋友稱為金毛。
這只金毛在野狐圍棋上名氣越來越大,直到世界人工智能圍棋大賽在今年4月20日公布參賽陣容時候,它的身份首次公開:就是“絕藝”的自家兄弟PhoenixGo。
PhoenixGo是微信的幾名工程師在開發(fā)機器翻譯引擎“之余”抽空研發(fā)的AI程序。它基于AlphaGo Zero論文實現(xiàn),同時做了若干提高訓練效率的創(chuàng)新,并利用微信服務器的閑時計算資源進行自我對弈,緩解了Zero版本對海量資源的苛刻需求。
微信團隊沒有公布如何基于AlphaGo Zero論文實現(xiàn),不過去年10月,DeepMind在Nature的一篇論文中,描述了AlphaGo Zero 的技術細節(jié)。
AlphaGo Zero完全不依賴于人類數(shù)據(jù),因此,這一系統(tǒng)的成功也是朝向人工智能研究長期以來的目標——創(chuàng)造出在沒有人類輸入的條件下,在最具挑戰(zhàn)性的領域實現(xiàn)超越人類能力的算法——邁進的一大步。
作者在論文中寫道,AlphaGo Zero 證明了即使在最具挑戰(zhàn)的領域,純強化學習的方法也是完全可行的:不需要人類的樣例或指導,不提供基本規(guī)則以外的任何領域知識,使用強化學習能夠實現(xiàn)超越人類的水平。此外,純強化學習方法只花費額外很少的訓練時間,但相比使用人類數(shù)據(jù),實現(xiàn)了更好的漸進性能(asymptotic performance)。
AlphaGo Zero在其他方面也與之前的版本有所不同:
AlphaGo Zero 只使用圍棋棋盤上的黑子和白子作為輸入,而上一版本的 AlphaGo 的輸入包含了少量人工設計的特征。
它只使用一個神經(jīng)網(wǎng)絡,而不是兩個。以前版本的 AlphaGo 使用一個“策略網(wǎng)絡”(policy network)來選擇下一個落子位置和一個“價值網(wǎng)絡”(value network)來預測游戲的贏家。這些在 AlphaGo Zero 中是聯(lián)合進行的,這使得它能夠更有效地進行訓練和評估。
AlphaGo Zero 不使用“走子演算”(rollout)——這是其他圍棋程序使用的快速、隨機游戲,用來預測哪一方將從當前的棋局中獲勝。相反,它依賴于高質量的神經(jīng)網(wǎng)絡來評估落子位置。
PhoenixGo對戰(zhàn)絕藝:騰訊自家兄弟的游戲
在世界人工智能圍棋大賽半決賽,PhoenixGo和絕藝分別順利擊敗Leela Zero和天算圍棋,令決賽成為騰訊兩兄弟的對決。
28日中午12:30,決賽首局開戰(zhàn)。
八冠王古力九段受邀為棋迷解說。猜到白棋的絕藝一出手就有創(chuàng)新,左下面對金毛的托扳定式,絕藝沒有采納人類耳熟能詳?shù)拇蛲暾成希亲叱龆返够⒌男率帧?/p>
隨后的進程,絕藝一直保持著大貼目下白方的后發(fā)優(yōu)勢。不過雙方差距并未拉大。
進入官子,執(zhí)黑的金毛在下方二路大跳,入侵白空。絕藝出人意料的脫先跑到右上扳角。嗅到機會的PhoenixGo出手狠辣,147凌空一擠,左上一隊白棋突然面臨生死之危。
突然而至的危機,并不會讓AI慌亂。
實戰(zhàn)絕藝順利將大隊人馬完整連回,但是勝負的重點仍在他處。繼續(xù)掌控先手的PhoenixGo回到下邊,令白棋目數(shù)大幅縮水。絕藝弈出一路“金雞獨立”經(jīng)典手筋,PhoenixGo177妙手一靠還以顏色。此處戰(zhàn)罷黑棋徹底完成逆轉。
又進行了40手,絕藝中盤認輸。
發(fā)球局被破,絕藝的決賽之旅頓生坎坷。
第2局拿到白棋的PhoenixGo發(fā)揮出色,始終保持著貼目優(yōu)勢,弈至159手絕藝強行收下右邊官子,打破局面平衡。
面對絕藝的進擊,PhoenixGo態(tài)度同樣強硬,一刀切斷黑棋19子大龍歸路。慘烈的攻殺開始,黑棋大龍幾經(jīng)輾轉,弈至191手雖能從上邊鑿出縫隙回家,但要付出左上角被吃的代價。
見此情景絕藝團隊主動認輸,比分變?yōu)?:0,PhoenixGo已經(jīng)提前奪冠。
最終,Phoenix Go 2:1擊敗絕藝,贏下本屆AI大賽,智能圍棋世界冠軍榜上又添新成員。
“星陣”戰(zhàn)勝柯潔,國產(chǎn)AI圍棋崛起
中國作為圍棋的發(fā)源地,在AlphaGo誕生后的幾年里也成為主要的AI圍棋源頭之一。
被同門兄弟擊敗的“絕藝”,是騰訊AI Lab于2016年3月4日開發(fā)出的AI圍棋,當年8月絕藝就首次戰(zhàn)勝職業(yè)棋手,11月第一次戰(zhàn)勝世界冠軍棋手江維杰(野狐ID若水云寒)。
2016年11月“絕藝”首次和柯潔交手,成績一勝一負;2017年2月14日以后,絕藝對野狐帽子(世界冠軍和全國冠軍)的勝率,已經(jīng)能夠穩(wěn)定在90%以上。不久前,“絕藝”還成為中國圍棋國家隊的訓練工具。
在PhoenixGo戰(zhàn)勝絕藝的同一個賽場上,另一家國產(chǎn)AI圍棋“星陣”戰(zhàn)勝了柯潔。
星陣的前身是清華大學由小川團隊研發(fā)的“神算子”,曾在比賽中戰(zhàn)勝世界冠軍孔杰九段。
據(jù)“AI前線”報道,由小川曾介紹,星陣也借鑒了AlphaGo的基本架構,但在特征體系、模型結構、MCTS 算法架構等方面有所創(chuàng)新,力爭用更少的計算資源和更少的訓練樣本完成模型學習。
現(xiàn)在,AlphaGo已經(jīng)退休,但是它啟發(fā)的無數(shù)后來者站在巨人的肩膀上,不斷探索計算的奧秘。
-
人工智能
+關注
關注
1796文章
47683瀏覽量
240311 -
騰訊
+關注
關注
7文章
1666瀏覽量
49607
原文標題:微信AI圍棋絕殺同門師兄“絕藝”,國產(chǎn)AI圍棋崛起
文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
相關推薦
評論