那曲檬骨新材料有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

解讀CV架構回歸多層感知機;自動生成模型動畫

智能感知與物聯網技術研究所 ? 來源:機器之心 ? 作者:機器之心 ? 2021-05-13 10:36 ? 次閱讀

本周的重要論文包括來自谷歌大腦的研究團隊提出了一種舍棄卷積和自注意力且完全使用多層感知機(MLP)的視覺網絡架構,在 ImageNet 數據集上實現了媲美 CNN 和 ViT 的性能表現;清華大學圖形學實驗室 Jittor 團隊提出了一種新的注意機制,通過控制記憶單元的大小,External-attention 可以輕松實現線性的復雜度等研究。

論文 1:MLP-Mixer: An all-MLP Architecture for Vision

摘要:計算機視覺的發展史證明,規模更大的數據集加上更強的計算能力往往能夠促成范式轉變。雖然卷積神經網絡已經成為計算機視覺領域的標準,但最近一段時間,基于自注意力層的替代方法 Vision Transformer(ViT)實現新的 SOTA 性能。從技術上講,ViT 模型延續了長久以來去除模型中手工構建特征和歸納偏置的趨勢,并進一步依賴基于原始數據的學習。

近日,原 ViT 團隊提出了一種不使用卷積或自注意力的 MLP-Mixer 架構(簡稱 Mixer),這是一種頗具競爭力并且在概念和技術上都非常簡單的替代方案。Mixer 架構完全基于在空間位置或特征通道重復利用的多層感知機(MLP),并且僅依賴于基礎矩陣乘法運算、數據布局變換(如 reshape 和 transposition)和非線性層。

JAX/Flax 編寫的 MLP-Mixer 代碼。

推薦:CV 領域網絡架構的演變從 MLP 到 CNN 到 Transformer 再回到 MLP,真是太有意思了。

論文 2:Beyond Self-attention: External Attention using Two Linear Layers for Visual Tasks

摘要:清華大學圖形學實驗室 Jittor 團隊提出了一種新的注意機制,稱之為「External Attention」,基于兩個外部的、小的、可學習的和共享的存儲器,只用兩個級聯的線性層和歸一化層就可以取代了現有流行的學習架構中的「Self-attention」,揭示了線性層和注意力機制之間的關系。自注意力機制一個明顯的缺陷在于計算量非常大,存在一定的計算冗余。通過控制記憶單元的大小,External-attention 可以輕松實現線性的復雜度。

d98242e8-b364-11eb-bf61-12bb97331649.jpg

Self Attention 和 External Attention 的區別。

推薦:External Attention 的部分計圖代碼已經在 Github 開源,后續將盡快開源全部計圖代碼。

論文 3:Learning Skeletal Articulations with Neural Blend Shapes

摘要:該論文由北京大學陳寶權教授研究團隊、北京電影學院未來影像高精尖創新中心、Google Research、特拉維夫大學以及蘇黎世聯邦理工學院合作,針對骨骼驅動的模型動畫的高質量自動化生成進行改進,提出了神經融合形狀技術。實驗證明,該方法顯著減少了已有方法中需要的人工干預,大大提升了生成動畫的質量。

具體而言,為了簡化骨骼搭建和蒙皮權重綁定的過程、高效利用動作捕捉數據以及生成高質量的動畫,研究者開發了一套能生成具有指定結構的骨骼以及精準綁定權重的神經網絡。加以他們提出的神經融合形狀(neural blend shapes)技術,研究者實現了實時高質量三維人物模型動畫的端到端自動生成。

d9d77bfa-b364-11eb-bf61-12bb97331649.jpg

框架概覽。

推薦:該論文已被計算機圖形學頂級會議 SIGGRAPH 2021 接收。

論文 4:A Survey of Modern Deep Learning based Object Detection Models

摘要:在本文中,來自阿斯隆理工學院的研究者概述了基于深度學習的目標檢測器的最新發展,提供了用于檢測的基準數據集和評估指標的簡要概述以及用于識別任務的主要主干架構。

da0bce78-b364-11eb-bf61-12bb97331649.jpg

文章結構。

推薦:基于現代深度學習的目標檢測模型綜述。

論文 5:Total Relighting: Learning to Relight Portraits for Background Replacement

摘要:在人像摳圖中,前景預測背景替換是至關重要的組成部分,此前也出現過各種效果不錯的摳圖方法,如商湯等提出的只需單張圖像、單個模型的方法 MODNet、華盛頓大學單塊 GPU 實現 4K 分辨率每秒 30 幀的 Background Matting 2.0 等。這些方法或多或少都有其局限性。

近日,來自谷歌的幾位研究者提出了一種全新的人像重照明(portrait relighting)和背景替換系統,該系統不僅保留了高頻邊界細節,并精確地合成了目標人像在新照明下的外觀,從而為任何所需場景生成逼真的合成圖像。該研究的亮點是通過前景蒙版(alpha matting)、重照明(relighting)和合成(compositing)進行前景估計。

推薦:該論文已被 SIGGRAPH 2021 會議接收。

論文 6:Graph Learning: A Survey

摘要:本文是對圖學習的最全面綜述,重點關注四類已有的圖學習方法,包括圖信號處理、矩陣分解、隨機游走和深度學習,回顧了采用這四類方法的主要模型和算法。此外,研究者探討了文本、圖像、科學、知識圖譜和組合優化等領域的圖學習應用。本文作者來自澳大利亞聯邦大學、大連理工、莫納什大學和亞利桑那州立大學。

推薦:最新圖機器學習論文綜述。

論文 7:Locate then Segment: A Strong Pipeline for Referring Image Segmentation

摘要:如何通過自然語言定位并分割出場景中的目標物體?比如給定一張圖片,語言指示 「分割出穿白色襯衫的人」。這個任務在學術界叫做指代性物體分割(Referring Image Segmentation)。目前指代性分割的工作通常著重于設計一種隱式的遞歸特征交互機制用于融合視覺 - 語言特征來直接生成最終的分割結果,而沒有顯式建模被指代物體的位置。

為了強調語言描述的指代作用,來自中科院自動化所、字節跳動的研究者將該任務解耦為先定位再分割的方案(LTS, Locate then Segment),它在直觀上也與人類的視覺感知機制相同。比如給定一句語言描述,人們通常首先會注意相應的目標圖像區域,然后根據對象的環境信息生成關于對象的精細分割結果。該方法雖然很簡單但效果較好。在三個流行的基準數據集上,該方法大幅度優于所有以前的方法。這個框架很有希望作為指代性分割的通用框架。

編輯:jq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • gpu
    gpu
    +關注

    關注

    28

    文章

    4775

    瀏覽量

    129357
  • 機器學習
    +關注

    關注

    66

    文章

    8438

    瀏覽量

    133086
  • 視覺感知
    +關注

    關注

    0

    文章

    44

    瀏覽量

    3219

原文標題:7 Papers & Radios | CV架構回歸多層感知機;自動生成模型動畫

文章出處:【微信號:tyutcsplab,微信公眾號:智能感知與物聯網技術研究所】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    基于移動自回歸的時序擴散預測模型

    回歸取得了比傳統基于噪聲的擴散模型更好的生成效果,并且獲得了人工智能頂級會議 NeurIPS 2024 的 best paper。 然而在時間序列預測領域,當前主流的擴散方法還是傳統的基于噪聲的方法,未能充分利用自
    的頭像 發表于 01-03 14:05 ?193次閱讀
    基于移動自<b class='flag-5'>回歸</b>的時序擴散預測<b class='flag-5'>模型</b>

    大語言模型優化生成管理方法

    大語言模型的優化生成管理是一個系統工程,涉及模型架構、數據處理、內容控制、實時響應以及倫理監管等多個層面。以下,是對大語言模型優化
    的頭像 發表于 12-02 10:45 ?142次閱讀

    多層感知器的基本原理

    多層感知器(MLP, Multi-Layer Perceptron)是一種前饋神經網絡,它通過引入一個或多個隱藏層來擴展單層感知器的功能,從而能夠解決復雜的非線性問題。BP網絡,即基于反向傳播算法
    的頭像 發表于 07-19 17:20 ?939次閱讀

    如何構建多層神經網絡

    構建多層神經網絡(MLP, Multi-Layer Perceptron)模型是一個在機器學習和深度學習領域廣泛使用的技術,尤其在處理分類和回歸問題時。在本文中,我們將深入探討如何從頭開始構建一個
    的頭像 發表于 07-19 17:19 ?1007次閱讀

    多層感知是什么?它有哪些作用?

    多層感知(Multilayer Perceptron,簡稱MLP)是一種基本的人工神經網絡模型,其結構由多個神經元組成的多層結構。它是一種
    的頭像 發表于 07-11 18:21 ?1574次閱讀

    多層感知模型結構

    和靈活的結構設計,在分類、回歸、模式識別等多個領域展現出卓越的性能。以下是對多層感知模型結構的詳細闡述。
    的頭像 發表于 07-11 17:57 ?1762次閱讀

    多層感知與神經網絡的區別

    (Feedforward Neural Networks)的一種基礎且廣泛使用的模型。以下將從多個方面詳細闡述多層感知和神經網絡之間的區別與聯系。
    的頭像 發表于 07-11 17:23 ?2257次閱讀

    不同類型神經網絡在回歸任務中的應用

    神經網絡是一種強大的機器學習模型,可以用于各種任務,包括回歸。在本文中,我們將討論不同類型的神經網絡,以及它們在回歸任務中的應用。 基本的神經網絡 基本的神經網絡,也稱為多層
    的頭像 發表于 07-11 10:27 ?1433次閱讀

    人工神經網絡模型包含哪些層次

    人工神經網絡(Artificial Neural Network,ANN)是一種模擬人腦神經網絡的計算模型,具有自適應、自學習、泛化能力強等特點。本文將詳細介紹人工神經網絡模型的各個層次,包括感知
    的頭像 發表于 07-05 09:17 ?714次閱讀

    人工智能神經網絡模型有哪些

    Rosenblatt在1957年提出。感知是一個二分類模型,它通過一組權重和偏置來計算輸入特征的線性組合,然后通過一個激活函數(通常是符號函數或階躍函數)來決定輸出。 多層
    的頭像 發表于 07-04 09:41 ?736次閱讀

    進一步解讀英偉達 Blackwell 架構、NVlink及GB200 超級芯片

    。 **5.**自動駕駛 在自動駕駛領域,Blackwell 架構的 GPU 可以用于感知和決策算法的計算,提高車輛的安全性和自主性。 這些只是英偉達 Blackwell
    發表于 05-13 17:16

    【大語言模型:原理與工程實踐】大語言模型的基礎技術

    模型架構奠定基礎。然后,引介一些經典的預訓練模型,如BERT、GPT等。最后,解讀ChatGPT和LLaMA系列模型,幫助讀者初步
    發表于 05-05 12:17

    如何提高自動駕駛汽車感知模型的訓練效率和GPU利用率

    由于采用了多攝像頭輸入和深度卷積骨干網絡,用于訓練自動駕駛感知模型的 GPU 內存占用很大。當前減少內存占用的方法往往會導致額外的計算開銷或工作負載的失衡。
    的頭像 發表于 04-29 09:12 ?977次閱讀
    如何提高<b class='flag-5'>自動</b>駕駛汽車<b class='flag-5'>感知</b><b class='flag-5'>模型</b>的訓練效率和GPU利用率

    未來已來,多傳感器融合感知自動駕駛破局的關鍵

    架構,預計未來許多智能駕駛團隊都會引入“占用網絡”來提升系統能力。多維像素的應用前景非常廣闊。昱感微的融合感知技術+BEV +Transformer+占用網格有望成為L3/L4級自動駕駛最優的落地方案。 昱感微電子融合
    發表于 04-11 10:26

    生成式 AI 制作動畫:周期短、成本低!

    工作室和特效公司正廣泛采用生成式AI技術進行背景生成、角色創作和動作合成。這種技術的應用不僅提高了動畫制作的效率,還使得動畫作品在視覺效果和創意上有了更大的突破。
    的頭像 發表于 03-18 08:19 ?3781次閱讀
    <b class='flag-5'>生成</b>式 AI 制作<b class='flag-5'>動畫</b>:周期短、成本低!
    百家乐官网博彩通博彩网皇冠网澳门赌场真人赌博 | 百家乐官网群1188999| 大发888官网吧| 下载百家乐棋牌大厅| 闲和庄百家乐官网娱乐场| 保山市| 威尼斯人娱乐城老品牌值得信赖| 百家乐比赛技巧| 百家乐官网大小技巧| 澳门金沙官网| 索雷尔百家乐的玩法技巧和规则| 百家乐接线玩法| 澳门百家乐官网博牌| 博彩通| 威尼斯人娱乐场xpjgw5xsjgw| 百家乐视频百家乐| 百家乐官网公式书| 蒙城县| 百家乐巴厘岛平台| 澳门百家乐官网技巧经| 和静县| 大发888娱乐场下载zhidu| 百家乐线上| 百家乐官网猪仔路| 长方形百家乐官网筹码| 威尼斯人娱乐城存款多少起存| 百家乐赌场论坛| 澳门百家乐必杀技| 真人百家乐官网软件云南景| 足球直播| 大发888boaicai| 大世界百家乐娱乐平台| 虎在什么方位做生意好| 游戏百家乐官网的玩法技巧和规则| 澳门百家乐官网玩法与游戏规则| 366娱乐城| 博彩公司排名| 大发888娱乐下载网址| 克拉克百家乐的玩法技巧和规则 | 大发888客户端 运行| 老人头百家乐的玩法技巧和规则|