那曲檬骨新材料有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

DeepMind又出AI大招

機器人技術與應用 ? 來源:機器人技術與應用 ? 作者:機器人技術與應用 ? 2021-03-11 15:58 ? 次閱讀

DeepMind 公司因為研制出會下棋的人工智能AlphaGo和AlphaZero而聲名鵲起,如今他們將注意力轉向了另一種棋盤游戲:強權外交(Diplomacy),也被稱為外交或者外交風云,是經典的桌面游戲之一。該游戲與圍棋不同,它是七人游戲,需要游戲玩家既競爭又合作,并且每回合玩家都會同時進行移動,因此,每個玩家都必須推理其他玩家的想法,非常復雜。

研制一個能玩外交游戲的人工智能軟件,DeepMind公司的計算機專家Andrea Tacchetti表示:“與游戲Go或國際象棋相比,這是一個本質上不同的問題。” 去年12月,Tacchetti和合作者在NeurIPS會議上就其系統發表了一篇論文,該論文介紹了能玩外交游戲的AI系統策略。

“外交”是一種策略游戲,在歐洲地圖上劃分為75個省。玩家建立并動員軍隊占領各省,直到控制了大部分補給中心的玩家獲勝。玩家每回合寫下自己的行動,然后執行。他們可以攻擊或防御對方玩家,或者支援對方玩家的進攻和防御,建立聯盟。在完整版中,玩家可以協商,為了方便人工智能研究,DeepMind公司使用了簡單版的“No Press”策略,不需要人工智能軟件發布策略與其他玩家進行溝通。

從歷史上看,人工智能使用人工制定的策略來發揮決策作用。2019年,蒙特利爾研究所的Mila通過使用深度學習系統取得了勝利。他們基于150000個人類游戲的數據集,訓練了一個稱為DipNet的神經網絡來模仿人類。DeepMind從DipNet版本開始,使用強化學習(一種反復試驗)來完善它。但是,僅通過反復試驗來探索可能性會帶來問題。因此,他們調整了強化學習算法。在訓練過程中,他們在每一步中都對對手的可能舉動進行采樣,計算出在這些情況下平均效果最佳的行動,然后訓練自己的權重以偏向于此行動。經過訓練,它跳過了采樣過程,僅根據其學習的知識進行工作。Tacchetti說:“我們論文的信息是:我們可以在這樣的環境中進行強化學習。” 他們設計的一個AI玩家與六個DipNet的AI贏了30%的時間(有14%的機會)。一個DipNet對抗他們的七個,僅贏得了3%的時間。

今年4月,Facebook將在ICLR會議上發表一篇論文,描述他們在“No Press”版本的外交游戲中的研究成果。他們建立了類似DipNet的網絡,但是沒有添加強化學習的元素,而是添加了一個“SearchBot”搜索玩家策略,SearchBot通過玩幾回合來評估玩家的每種潛在策略(假設每個人都根據神經網絡的首選選擇后續行動)。策略不是一個最佳行動組合,而是由50個可能行動組成的一組概率(由神經網絡建議)。

在真實游戲中進行這樣的探索會減慢SearchBot的速度,但可以使它更優于DipNet。SearchBot在外交游戲網站上與人類進行了匿名比賽,在玩家中排名前2%。Facebook的計算機專家、論文的共同作者亞當·勒勒(Adam Lerer)說:“這是第一個被證明具有能與人類競爭的機器人。”

責任編輯:lq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 人工智能
    +關注

    關注

    1796

    文章

    47683

    瀏覽量

    240307
  • 強化學習
    +關注

    關注

    4

    文章

    268

    瀏覽量

    11302
  • DeepMind
    +關注

    關注

    0

    文章

    131

    瀏覽量

    10942

原文標題:DeepMind又出AI大招

文章出處:【微信號:robotmagazine,微信公眾號:機器人技術與應用】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    DeepMind創始人預計年內有AI設計藥物進入臨床試驗

    近日,英國人工智能公司DeepMind的創始人兼首席執行官德米斯·哈薩比斯(Demis Hassabis)透露,預計在今年年底前,將有人工智能(AI)設計的藥物進入臨床試驗階段。
    的頭像 發表于 01-24 15:46 ?1303次閱讀

    谷歌加速AI部門整合:AI Studio團隊并入DeepMind

    近日,谷歌正緊鑼密鼓地推進其人工智能(AI)部門的整合工作。據谷歌AI Studio主管Logan Kilpatrick在領英頁面上的透露,谷歌已將AI Studio團隊整體轉移至DeepMi
    的頭像 發表于 01-13 14:40 ?248次閱讀

    谷歌Vertex AI助力企業生成式AI應用

    DeepMind 在模型技術方面積極探索創新,尤其著力于 Gemini 和 Imagen 的改進。我們的企業 AI 平臺 Vertex AI 也推出了數十項突破性功能。
    的頭像 發表于 09-09 15:59 ?580次閱讀

    云開發AI助手

    AI
    草帽王路飛
    發布于 :2024年07月22日 14:41:54

    谷歌DeepMind被曝抄襲開源成果,論文還中了頂流會議

    谷歌DeepMind一篇中了頂流新生代會議CoLM 2024的論文被掛了,瓜主直指其抄襲了一年前就掛在arXiv上的一項研究。開源的那種。
    的頭像 發表于 07-16 18:29 ?650次閱讀
    谷歌<b class='flag-5'>DeepMind</b>被曝抄襲開源成果,論文還中了頂流會議

    AI終端應用元年到來,史密斯英特康突破AI芯片測試挑戰

    2024年,文生視頻工具——Sora的誕生為已然熱鬧的AI 應用領域又添了一把火。 近日,Google的人工智能(AI)研究實驗室DeepMind表示,它正在開發為視頻生成配樂的人
    的頭像 發表于 06-21 11:10 ?408次閱讀
    <b class='flag-5'>AI</b>終端應用元年到來,史密斯英特康突破<b class='flag-5'>AI</b>芯片測試挑戰

    谷歌AI新突破:為無聲視頻智能配音

    近日,谷歌DeepMind團隊公布了一項革命性的技術——利用AI為無聲視頻生成背景音樂的“video-to-audio”技術。這一技術的出現,不僅為視頻創作領域帶來了新的可能,也為觀眾帶來了更加豐富的視聽體驗。
    的頭像 發表于 06-21 10:50 ?550次閱讀

    蘋果WWDC 2024日程揭曉:大招碼上來

    蘋果公司近日公布了備受期待的2024年度WWDC(全球開發者大會)的詳細日程安排。今年的WWDC將于太平洋時間6月10日至14日舉行,活動口號“大招碼上來”預示著蘋果將帶來一系列令人振奮的新技術和產品更新。
    的頭像 發表于 05-30 09:24 ?794次閱讀

    谷歌DeepMind發布人工智能模型AlphaFold最新版本

    谷歌DeepMind近日發布了人工智能模型AlphaFold的最新版本——AlphaFold 3,這一革命性的工具將在藥物發現和疾病治療領域發揮巨大作用。
    的頭像 發表于 05-10 11:26 ?638次閱讀

    谷歌DeepMind推出新一代藥物研發AI模型AlphaFold 3

    谷歌DeepMind公司近日重磅推出了一款名為AlphaFold 3的全新藥物研發AI模型,這一創新技術將為科學家們提供前所未有的幫助,使他們能更精確地理解疾病機制,進而開發出更高效的治療藥物。
    的頭像 發表于 05-10 09:35 ?440次閱讀

    微軟斥資25億英鎊在倫敦新建AI Hub,推動AI技術發展與商業化落地

    同時,微軟還在四月初宣布成立全新的Microsoft AI團隊,由DeepMind與Inflection聯合創始人Mustafa Suleyman擔任負責人,全力推動Copilot項目實施。Jordan Hoffmann則將領銜領導位于倫敦的Microsoft
    的頭像 發表于 04-09 16:22 ?529次閱讀

    微軟宣布組織架構調整,組建Microsoft AI

    微軟,這家全球市值最高的科技巨頭,近日宣布了一項重大的組織架構調整。公司決定組建全新的Microsoft AI部門,旨在統一管理和推進所有消費者AI產品和研究工作。為此,微軟特地挖角了人工智能領域的知名人物——DeepMind
    的頭像 發表于 03-21 10:52 ?932次閱讀

    谷歌DeepMind推出SIMI通用AI智能體

    近日,谷歌的DeepMind團隊發布了其最新研究成果——SIMI(Scalable Instructable Multiworld Agent),這是一個通用人工智能智能體,能夠在多種3D虛擬環境
    的頭像 發表于 03-18 11:39 ?1055次閱讀

    谷歌DeepMind推新AI模型Genie,能生成2D游戲平臺

    據報道,谷歌公司的DeepMind團隊近期發布了AI模型Genie,此模型擁有多達110億個參數,能夠依據用戶提供的圖片及提示詞創建出相當完整的2D游戲場景。
    的頭像 發表于 02-27 14:53 ?845次閱讀

    微軟與法國 Mistral AI聯手,拓展生成式人工智能領域

     值得注意的是,Mistral AI成立于2023年4月,由Meta和DeepMind前高管創立。截至2023年底,該公司募集資金大約4.15億美元,預計微軟的注資將進一步推動該公司市值上升。
    的頭像 發表于 02-27 10:40 ?627次閱讀
    百家乐真钱送彩金| 百家乐官网游戏研发| 百家乐长龙如何判断| 百家乐官网视频打牌| 百家乐有送体验金| 通山县| 线上百家乐开户| 百家乐官网投注方法多不多| 百家乐官网必胜法技巧| 大发888中文版| 莫斯科百家乐官网的玩法技巧和规则 | 中骏百家乐官网的玩法技巧和规则| 最新皇冠足球投注比分网| 百家乐规则博彩正网| 尊爵国际娱乐| 任你博百家乐现金网| 百家乐官网编单短信接收| 大发888账号| 百家乐官网棋牌游戏币| 百家乐官网玩法守则| 大发888游戏平台403| 百家乐试玩账户| 百家乐官网技术方式| 裕昌太阳城户型图| 百家乐娱乐求指点呀| 百家乐官网筹码真伪| tt娱乐城备用网| 真钱百家乐公司哪个好| 澳门百家乐官网哪家信誉最好| 全讯网六| 至尊百家乐下载| 百家乐官网视频视频| 新全讯网网站| 缅甸百家乐博彩| 电玩百家乐官网游戏机路单| 申博娱乐城开户| 百家乐路单下| CEO百家乐官网的玩法技巧和规则| 百家乐官网下注几多| 盛大娱乐城现金网| 网上百家乐游戏下载|