那曲檬骨新材料有限公司

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌大腦的“世界模型”簡(jiǎn)述與啟發(fā)

mK5P_AItists ? 來源:lq ? 2019-01-30 09:48 ? 次閱讀

摘要:我們的視覺看到什么,部分取決于大腦預(yù)測(cè)未來會(huì)看到什么。

我們的視覺看到什么,部分取決于大腦預(yù)測(cè)未來會(huì)看到什么,例如下圖中,如果你預(yù)計(jì)要看到突出的球體,那也許你就會(huì)看到,如果讓機(jī)器也具有了這樣的能力,會(huì)帶來什么了?

18年谷歌大腦提出“世界模型”(World Models)可以在復(fù)雜的環(huán)境中通過自我學(xué)習(xí)產(chǎn)生相應(yīng)的策略,例如玩賽車游戲。

下面是世界模型的整體架構(gòu):

整個(gè)模型分為3個(gè)組件:視覺組件(V),記憶組件(M),控制組件(C)。視覺組件V用來壓縮圖片信息到一個(gè)隱變量z上(其實(shí)只是一個(gè)VAE編碼解碼器):

記憶組件M的輸入是一幀幀的游戲圖片(論文中的一幀圖像似乎叫一個(gè)rollout),輸出是預(yù)測(cè)下一幀圖像的可能分布,其實(shí)就是比一般LSTM更高級(jí)一些的MDN-RNN:

最后控制組件C的目標(biāo),就是把前面視覺組件V和記憶組件M的輸出一起作為輸入,并輸出這個(gè)時(shí)刻智能體agent應(yīng)該做出的動(dòng)作(action)。

在所謂的“世界模型”,其中的組件模型幾乎沒有是谷歌大腦自己創(chuàng)新研制的。但世界模型會(huì)很大提高強(qiáng)化學(xué)習(xí)訓(xùn)練穩(wěn)定性和成績(jī) 從而使其與其他強(qiáng)化學(xué)習(xí)相比有一些明顯優(yōu)勢(shì),如下表所示;

世界模型有如下的3個(gè)特點(diǎn)

1. 模型拼接得足夠巧妙,這個(gè)巧妙的拼接模型做到所謂的世界想象能力,就是模型在學(xué)習(xí)時(shí),自身對(duì)環(huán)境假想一個(gè)模擬的環(huán)境,甚至可以在沒有環(huán)境訓(xùn)練的情況下,自己想象一個(gè)環(huán)境去訓(xùn)練。其實(shí)就是我們?nèi)祟愮R像神經(jīng)元的功能。

2. 抓住了一些“強(qiáng)視覺”游戲的“痛點(diǎn)”。記憶組件M中的RNN是生成序列的能手,所以根據(jù)之前游戲圖像再“想象”一些圖像幀應(yīng)該不成問題(RNN生成一些隱變量z,再根據(jù)隱變量z,由視覺組件VAE的decode生成的圖像幀即可)。所以對(duì)于“強(qiáng)視覺”的游戲,把RNN的記憶能力用在視覺預(yù)測(cè)和控制上是個(gè)好主意 。

3不同于我們常見的“不可生”智能算法,例如遺傳算法和進(jìn)化策略只是強(qiáng)調(diào)了基因的“變異”與在解空間中進(jìn)行搜索,神經(jīng)網(wǎng)絡(luò)只是固定網(wǎng)絡(luò)結(jié)構(gòu);而生物界的基因卻可以指導(dǎo)蛋白質(zhì)構(gòu)成并且“生長(zhǎng)”。如果基因可以構(gòu)造自身個(gè)體,外部環(huán)境和個(gè)體情況也可以反過來影響基因,而我們的模型都太固定呆板了,模型結(jié)構(gòu)不能隨內(nèi)部隱變量改進(jìn),當(dāng)然最佳的設(shè)計(jì)形式也許誰也不知道。而世界模型做到了讓在內(nèi)部”幻想“的環(huán)境中產(chǎn)生的策略轉(zhuǎn)移到外部世界中。

最后簡(jiǎn)單看一下世界模型的訓(xùn)練過程:

world models代碼基于chainer計(jì)算框架,步驟如下:

1. 準(zhǔn)備數(shù)據(jù)集,隨機(jī)玩游戲生成訓(xùn)練幀(rollouts意思應(yīng)該就是多少幀):

python random_rollouts.py--gameCarRacing-v0 --num_rollouts10000

2. 訓(xùn)練視覺組件V,即前面提到的VAE:

python vision.py--gameCarRacing-v0 --z_dim32--epoch1

3. 訓(xùn)練記憶組件M,即前面提到的RNN:

python model.py--gameCarRacing-v0 --z_dim32--hidden_dim256--mixtures5--epoch20

4. 訓(xùn)練控制組件C,即前面提到的CMA-ES算法(其實(shí)就是支持更復(fù)雜輸入和更新的ES):

python controller.py--gameCarRacing-v0 --lambda_64--mu0.25--trials16--target_cumulative_reward900--z_dim32--hidden_dim256--mixtures5--temperature1.0--weights_type1[--cluster_mode]

5. 測(cè)試訓(xùn)練結(jié)果:

python test.py--gameCarRacing-v0 --z_dim32--hidden_dim256--mixtures5--temperature1.0--weights_type1--rollouts100[--record]

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6196

    瀏覽量

    106020
  • 機(jī)器
    +關(guān)注

    關(guān)注

    0

    文章

    784

    瀏覽量

    40824
  • 智能體
    +關(guān)注

    關(guān)注

    1

    文章

    166

    瀏覽量

    10616

原文標(biāo)題:谷歌大腦的“世界模型”簡(jiǎn)述與啟發(fā)

文章出處:【微信號(hào):AItists,微信公眾號(hào):人工智能學(xué)家】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    谷歌發(fā)布全新AI基礎(chǔ)世界模型Genie

    谷歌近日宣布推出其最新研發(fā)的AI基礎(chǔ)世界模型——Genie。這款模型擁有驚人的110億參數(shù),其獨(dú)特之處在于,僅需一張圖片,便能生成一個(gè)充滿活力和交互性的虛擬
    的頭像 發(fā)表于 03-04 14:02 ?821次閱讀

    谷歌模型合成工具在哪找到

    谷歌模型合成工具可以在谷歌的官方網(wǎng)站或相關(guān)的開發(fā)者平臺(tái)上找到。具體地,您可以嘗試訪問谷歌的AI平臺(tái)或開發(fā)者社區(qū),以獲取有關(guān)模型合成工具的最新
    的頭像 發(fā)表于 03-01 18:13 ?1624次閱讀

    谷歌模型框架是什么軟件?谷歌模型框架怎么用?

    谷歌模型框架通常指的是谷歌開發(fā)的用于機(jī)器學(xué)習(xí)和人工智能的軟件框架,其中最著名的是TensorFlow。TensorFlow是一個(gè)開源的機(jī)器學(xué)習(xí)框架,由谷歌的機(jī)器學(xué)習(xí)團(tuán)隊(duì)開發(fā),用于構(gòu)建和
    的頭像 發(fā)表于 03-01 16:25 ?971次閱讀

    谷歌模型訓(xùn)練軟件有哪些?谷歌模型訓(xùn)練軟件哪個(gè)好?

    谷歌模型訓(xùn)練方面提供了一些強(qiáng)大的軟件工具和平臺(tái)。以下是幾個(gè)常用的谷歌模型訓(xùn)練軟件及其特點(diǎn)。
    的頭像 發(fā)表于 03-01 16:24 ?981次閱讀

    谷歌模型怎么用手機(jī)打開

    要使用手機(jī)打開谷歌模型,首先需要明確一點(diǎn):谷歌模型本身是在計(jì)算機(jī)上運(yùn)行的程序或算法,而不是可以直接在手機(jī)上打開的應(yīng)用程序。然而,你可以通過手機(jī)訪問
    的頭像 發(fā)表于 03-01 16:23 ?681次閱讀

    谷歌模型軟件有哪些功能

    谷歌模型軟件通常指的是谷歌推出的一系列人工智能模型和軟件工具,其中最具代表性的是Google Gemini。Google Gemini是谷歌
    的頭像 發(fā)表于 03-01 16:20 ?751次閱讀

    谷歌模型合成軟件有哪些

    谷歌模型合成軟件通常指的是谷歌提供的用于創(chuàng)建、修改和共享3D模型的軟件。目前,谷歌推出的模型合成
    的頭像 發(fā)表于 02-29 18:20 ?1468次閱讀

    谷歌模型軟件有哪些好用的

    谷歌模型軟件的好用程度可能因個(gè)人需求和技能水平而異,但以下是一些廣受歡迎的谷歌模型軟件,它們?cè)诟髯缘念I(lǐng)域內(nèi)有著出色的表現(xiàn)。
    的頭像 發(fā)表于 02-29 18:17 ?1148次閱讀

    谷歌模型框架是什么?有哪些功能和應(yīng)用?

    谷歌模型框架(Google Model Framework)并不是一個(gè)特定的框架,而是指谷歌開發(fā)的一系列軟件框架,用于支持機(jī)器學(xué)習(xí)和人工智能的應(yīng)用。以下是一些與谷歌
    的頭像 發(fā)表于 02-29 18:11 ?1594次閱讀

    谷歌發(fā)布全新AI模型Genie

    谷歌近日發(fā)布了其全新的AI模型Genie,這一模型徹底改變了我們與數(shù)字世界的互動(dòng)方式。Genie不僅可以接收文本提示、草圖或想法,還能將這些創(chuàng)意迅速轉(zhuǎn)化為一個(gè)可互動(dòng)和玩耍的虛擬
    的頭像 發(fā)表于 02-28 18:25 ?1768次閱讀

    谷歌發(fā)布基礎(chǔ)世界模型Genie,世界模型領(lǐng)域競(jìng)爭(zhēng)升溫

    繼OpenAI和Meta之后,谷歌也在世界模型領(lǐng)域公布了其最新進(jìn)展。據(jù)谷歌官網(wǎng)介紹,Genie是一個(gè)基于互聯(lián)網(wǎng)視頻訓(xùn)練的基礎(chǔ)世界
    的頭像 發(fā)表于 02-28 18:20 ?1482次閱讀

    谷歌發(fā)布AI基礎(chǔ)世界模型Genie

    谷歌近日宣布了其生成式AI的全新里程碑——全新AI基礎(chǔ)世界模型Genie。這一創(chuàng)新技術(shù)允許用戶通過單張圖像提示,生成一個(gè)可玩的、交互式的虛擬環(huán)境,從而開啟了一個(gè)全新的數(shù)字體驗(yàn)時(shí)代。
    的頭像 發(fā)表于 02-28 17:41 ?896次閱讀

    谷歌發(fā)布新型AI模型Genie

    近日,谷歌推出了一款革命性的AI模型——Genie。這款模型能夠?qū)⒑?jiǎn)單的文本提示、草圖或初步想法迅速轉(zhuǎn)化為一個(gè)可以互動(dòng)和游戲的虛擬世界。這一突破性的技術(shù)無疑將改變?nèi)藗儎?chuàng)建和體驗(yàn)虛擬
    的頭像 發(fā)表于 02-28 10:05 ?821次閱讀

    谷歌交互世界模型重磅發(fā)布

    谷歌模型
    北京中科同志科技股份有限公司
    發(fā)布于 :2024年02月28日 09:13:06

    谷歌開源70億參數(shù)大語言模型,全方位超越Meta Llama-2?

    基于Gemini打造的開源模型Gemma。 ? 谷歌加入AI模型開源陣營(yíng),Gemma橫空出世 ? 根據(jù)谷歌的介紹,Gemma是由谷歌Deep
    的頭像 發(fā)表于 02-23 00:15 ?3573次閱讀
    <b class='flag-5'>谷歌</b>開源70億參數(shù)大語言<b class='flag-5'>模型</b>,全方位超越Meta Llama-2?
    百家乐新庄| 景宁| 快乐之都| 百家乐官网大赌场娱乐网规则| 永利百家乐的玩法技巧和规则| 百家乐官网视频连连看| 玩百家乐怎么才能赢| bet365投注| 百家乐视频台球下载| 巩留县| 百家乐上分器定位器| 日博网| 正规百家乐游戏下载| 饶河县| 金银岛百家乐的玩法技巧和规则 | 真人百家乐新开户送彩金| 房产| 英皇百家乐的玩法技巧和规则 | 白金国际娱乐城| 钱百家乐取胜三步曲| 网页百家乐官网| 赌场百家乐图片| 百家乐官网闲9点| 钱大发888游戏下载| 鑫鑫百家乐官网的玩法技巧和规则| 百家乐专业赌| 百家乐官网发牌盒子| 88娱乐城网址| 太阳城百家乐的破解| 真人百家乐官网破解软件下载| 威尼斯人娱乐城真实网址| 新乐园百家乐官网娱乐城| 措美县| 威尼斯人娱乐城优惠活动| 迷你百家乐官网的玩法技巧和规则| 皇冠现金开户| 线上百家乐赢钱| 百家乐官网六合彩3535| 大发888游戏下载官方| 百家乐视频二人雀神| 百家乐官网币|