那曲檬骨新材料有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

谷歌發明的由2D圖像生成3D圖像技術解析

我快閉嘴 ? 來源:愛集微 ? 作者:嘉德IPR ? 2020-12-24 12:55 ? 次閱讀

谷歌發明的由2D圖像生成3D圖像的技術,利用3D估計神經網絡圖像信息的補全以及預測,融合了拍攝角度、光照等信息,讓生成的3D圖像看起來更加逼真,這種技術對于三維建模以及工業應用都具有極大的指導意義。

谷歌研究人員制作的一個AI工具,可以把涂鴉變成奇怪的怪物。這款工具名為Chimera Painter,使用機器學習來根據用戶的粗略草圖生成圖像。

Chimera Painter背后的團隊在一篇博客文章中解釋了他們的方法和動機,稱他們的想法是創造一種 “畫筆,它的行為不像工具,而更像助手”。Chimera Painter只是一個原型,但如果這樣的軟件變得普遍,它可以減少創造高質量藝術所需的時間。

這種圖像生成技術,其實在三維渲染方面有著非常廣泛的應用,其中最具有代表性的工作之一,就是由2D圖像生成3D圖像。我們知道,3D圖像相比于2D圖像多了深度信息這一個維度,但也就是這一個差別,導致了3D圖像相比于2D圖像所多出的信息不是一星半點。因此,倘若想要從2D圖像生成3D圖像,其難度之大可想而知。

為此,谷歌在18年10月18日申請了一項名為“通過渲染許多3D視圖來學習重構3D形狀”的發明專利(申請號:201880030823.5),申請人為谷歌有限責任公司。

根據該專利目前公開的資料,讓我們一起來看看這項從2D圖像到3D圖像的生成方法吧。

谷歌發明的由2D圖像生成3D圖像技術解析

該技術中,主要使用了3D估計器神經網絡,如上圖,為使用3D估計器神經網絡來估計圖像中描繪的面部的3D形狀和紋理,并基于估計的3D形狀和紋理生成替身的系統示意圖。用戶通過上傳面部圖像105,系統100可以對照片進行處理后生成替身115,這里所說的替身也就是用戶的3D畫像。

在具體的過程中,照片首先由面部識別引擎110進行處理,從而生成用戶的面部圖像特征112,該特征在3D估計神經網絡中被處理,基于圖像特征估計照片中描繪的用戶面部的3D形狀和紋理,從而生成形狀紋理數據122。

最后,數據122被發送到3D渲染引擎130中,基于用戶獨特的面部形狀、紋理特征來生成用戶的3D畫像,并且為了做到更加真實,渲染引擎可以給出特定的視圖,視圖中融合了相機角度、光照以及視場的估計信息,可以讓生成的圖像質量更加逼真。

谷歌發明的由2D圖像生成3D圖像技術解析

如上圖,為用于用戶3D渲染圖像生成的3D估計器神經網絡220的系統框圖,整個系統的結構還是相當復雜的,從圖中我們可以看到這種神經網絡是如何工作的。根據目前的技術來看,訓練3D估計器神經網絡通常有兩個困難:第一,由3D對象的圖像和那些3D對象的3D形狀和紋理組成的訓練對通常是有限的并且難以獲得;第二,訓練3D估計器神經網絡可能經常導致3D估計器神經網絡的網絡欺騙。

因此,該專利發明的整個網絡分為了監督訓練回路以及無監督訓練回路,通過二者相結合的方式,在完全訓練階段期間,僅利用無監督訓練回路,從而允許估計神經網絡輸出更快地收斂。

因為無監督訓練回路可以在預訓練階段和完全訓練階段兩者期間使用,所以從無監督訓練回路開始,在預訓練之后,完全訓練可以對大量迭代和大量樣本單獨利用無監督訓練回路,來改進3D估計神經網絡估計圖像中的對象的3D形狀和紋理的能力。

谷歌發明的由2D圖像生成3D圖像技術解析

最后,是這種無監督訓練回路訓練的流程圖,系統首先需要獲取對象圖像的第一圖像特征,該特征就是上述所說用戶面部信息的原始數據,其次,將這種第一圖像特征提供給3D估計器神經網絡并獲取3D形狀和紋理。

根據這些形狀和紋理進行3D渲染,并從多個3D視圖中導出第二圖像特征,基于圖像特征的損失函數計算損失,以知道神經網絡進行反向傳播以得到更加良好的效果以及減少圖像生成的損失。

以上就是谷歌發明的利用2D圖像生成3D圖像的專利技術,從2D到3D圖像的轉換過程中,由于2D圖像缺少了很多信息,因此該技術利用3D估計神經網絡進行信息的補全以及預測,并融合了拍攝角度、光照等信息,讓生成的3D圖像看起來更加逼真,這種技術對于三維建模以及工業應用都具有極大的指導意義。

關于嘉德

深圳市嘉德知識產權服務有限公司由曾在華為等世界500強企業工作多年的知識產權專家、律師、專利代理人組成,熟悉中歐美知識產權法律理論和實務,在全球知識產權申請、布局、訴訟、許可談判、交易、運營、標準專利協同創造、專利池建設、展會知識產權、跨境電商知識產權、知識產權海關保護等方面擁有豐富的經驗。
責任編輯:tzh

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 3D
    3D
    +關注

    關注

    9

    文章

    2910

    瀏覽量

    107989
  • 谷歌
    +關注

    關注

    27

    文章

    6194

    瀏覽量

    106013
  • 神經網絡
    +關注

    關注

    42

    文章

    4779

    瀏覽量

    101165
收藏 人收藏

    評論

    相關推薦

    AN-1249:使用ADV8003評估板將3D圖像轉換成2D圖像

    電子發燒友網站提供《AN-1249:使用ADV8003評估板將3D圖像轉換成2D圖像.pdf》資料免費下載
    發表于 01-08 14:28 ?0次下載
    AN-1249:使用ADV8003評估板將<b class='flag-5'>3D</b><b class='flag-5'>圖像</b>轉換成<b class='flag-5'>2D</b><b class='flag-5'>圖像</b>

    技術前沿:半導體先進封裝從2D3D的關鍵

    技術前沿:半導體先進封裝從2D3D的關鍵 半導體分類 集成電路封測技術水平及特點?? ? 1. 發展概述 ·自20世紀90年代以來,集成電路封裝
    的頭像 發表于 01-07 09:08 ?393次閱讀
    <b class='flag-5'>技術</b>前沿:半導體先進封裝從<b class='flag-5'>2D</b>到<b class='flag-5'>3D</b>的關鍵

    3D封裝熱設計:挑戰與機遇并存

    隨著半導體技術的不斷發展,芯片封裝技術也在持續進步。目前,2D封裝和3D封裝是兩種主流的封裝技術。這兩種封裝
    的頭像 發表于 07-25 09:46 ?1528次閱讀
    <b class='flag-5'>3D</b>封裝熱設計:挑戰與機遇并存

    歡創播報 騰訊元寶首發3D生成應用

    App。 騰訊元寶APP發布時,就圍繞工作效率場景、日常生活等場景提供了豐富的應用,并有創建個人智能體等個性化體驗,“3D角色夢工廠”則將大模型生成技術3D應用結合,進一步創新了元寶
    的頭像 發表于 07-18 11:39 ?824次閱讀
    歡創播報 騰訊元寶首發<b class='flag-5'>3D</b><b class='flag-5'>生成</b>應用

    裸眼3D筆記本電腦——先進的光場裸眼3D技術

    效果的用戶,這款筆記本電腦都能滿足你的需求。 一、卓越的3D模型設計能力 英倫科技裸眼3D筆記本電腦采用最新的光場裸眼3D技術,使用戶無需佩戴3D
    的頭像 發表于 07-16 10:04 ?654次閱讀

    蘇州吳中區多色PCB板元器件3D視覺檢測技術

    3D視覺檢測相較于2D視覺檢測,有其獨特的優勢,不受產品表面對比度影響,精確檢出產品形狀,可以測出高度(厚度)、體積、平整度等。在實際應用中可以與2D結合做檢測。利用3D的特性,可以檢
    的頭像 發表于 06-14 15:02 ?460次閱讀
    蘇州吳中區多色PCB板元器件<b class='flag-5'>3D</b>視覺檢測<b class='flag-5'>技術</b>

    英倫科技的15.6寸2D-3D可切換光場裸眼3D顯示屏有哪些特點?

    隨著科技的快速發展,人類對于視覺體驗的追求也在不斷攀升。從平面的2D圖像到立體的3D影像,我們一直在探索如何讓虛擬世界更加逼真。如今,英倫科技憑借其創新實力,推出了一款革命性的顯示設備——15.6寸
    的頭像 發表于 05-28 11:17 ?414次閱讀
    英倫科技的15.6寸<b class='flag-5'>2D-3D</b>可切換光場裸眼<b class='flag-5'>3D</b>顯示屏有哪些特點?

    Teledyne e2v公司和Airy3D公司合作,提供更實惠的3D視覺解決方案

    。 △Topaz5D?是一款1,920 x 1,080分辨率的低噪聲全局快門2D3D圖像傳感器。Teledyne e2v Teledyne
    的頭像 發表于 05-11 10:12 ?457次閱讀
    Teledyne e<b class='flag-5'>2</b>v公司和Airy<b class='flag-5'>3D</b>公司合作,提供更實惠的<b class='flag-5'>3D</b>視覺解決方案

    NVIDIA Instant NeRF將多組靜態圖像變為3D數字場景

    想象一幅風光旖旎的畫面,比如水畔的懸崖峭壁。即便只是 2D 圖像,如此美景依舊令人心馳神往。如果同一畫面能以 3D 效果展現,那么無需跋涉就能身臨其境。
    的頭像 發表于 05-07 09:15 ?454次閱讀

    通過2D/3D異質結構精確控制鐵電材料弛豫時間

    受經典德拜弛豫啟發的米勒模型提供了通過操縱弛豫時間來控制自發極化的理論框架。作者通過使用層轉移技術形成的2D/C-3D/2D異質結構克服了傳統異質結存在的鐵電性惡化和能量損失的問題。
    的頭像 發表于 04-29 10:27 ?800次閱讀
    通過<b class='flag-5'>2D</b>/<b class='flag-5'>3D</b>異質結構精確控制鐵電材料弛豫時間

    Teledyne e2v宣布推出一款全高清CMOS圖像傳感器:Topaz5D?

    據麥姆斯咨詢報道,近期,Teledyne科技旗下公司、全球成像解決方案創新者Teledyne e2v宣布推出一款全高清CMOS圖像傳感器:Topaz5D?,旨在將2D視覺與
    的頭像 發表于 04-11 14:14 ?701次閱讀

    有了2D NAND,為什么要升級到3D呢?

    2D NAND和3D NAND都是非易失性存儲技術(NVM Non-VolatileMemory),屬于Memory(存儲器)的一種。
    的頭像 發表于 03-17 15:31 ?1125次閱讀
    有了<b class='flag-5'>2D</b> NAND,為什么要升級到<b class='flag-5'>3D</b>呢?

    將MLX75027 3D圖像傳感器與CX3 RDK MIPI開發板連接后報錯如何解決?

    我們打算將MLX75027 3D圖像傳感器與CX3 RDK MIPI開發板連接,但EZ-USB-suite軟件中配置MIPI塊參數中針對的是2D圖像
    發表于 02-28 07:41

    Nullmax提出多相機3D目標檢測新方法QAF2D

    今天上午,計算機視覺領域頂會CVPR公布了最終的論文接收結果,Nullmax感知部門的3D目標檢測研究《Enhancing 3D Object Detection with 2D Detection-Guided Query A
    的頭像 發表于 02-27 16:38 ?1209次閱讀
    Nullmax提出多相機<b class='flag-5'>3D</b>目標檢測新方法QAF<b class='flag-5'>2D</b>

    谷歌DeepMind推新AI模型Genie,能生成2D游戲平臺

    據報道,谷歌公司的DeepMind團隊近期發布了AI模型Genie,此模型擁有多達110億個參數,能夠依據用戶提供的圖片及提示詞創建出相當完整的2D游戲場景。
    的頭像 發表于 02-27 14:53 ?842次閱讀
    视频百家乐官网破解| 百家乐赢钱绝技| 百家乐是个什么样的游戏| 宝龙国际娱乐城| 南京百家乐官网电| 大发888充值100元| 百家乐官网mediacorp| 百家乐b28博你| 百家乐官网群东方鸿运| 澳门百家乐真人娱乐城| 尊龙国际| 百家乐官网怎么才能包赢| KK百家乐娱乐城| 百家乐官网玩法开户彩公司| 百家乐送錢平臺| 澳门百家乐官网门路| 百家乐投注注技巧| 东安县| 至尊百家乐20111110| 大英县| 线上百家乐代理| 互博百家乐官网现金网| 百家乐庄家优势| 百家乐官网取胜秘笈| 网络百家乐会作假吗| 百家乐官网免费路单| 百家乐单机版游戏下载| 百家乐官网娱乐城彩金| 仕達屋百家乐的玩法技巧和规则| 百家乐官网21点德州扑克| 免费百家乐过滤工具| 百家乐官网凯时娱乐平台| 大发888188| 无锡百家乐官网的玩法技巧和规则| 大发888注册送28| 百家乐二人视频麻将| 网上百家乐官网追杀| 百家乐机器出千| 现金百家乐官网赢钱| 大发888下载不了| 百家乐赌博机原理|