那曲檬骨新材料有限公司

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

一種用機(jī)器學(xué)習(xí)進(jìn)行3D實(shí)時渲染的新方法:用paGAN實(shí)現(xiàn)3D實(shí)時渲染

zhKF_jqr_AI ? 來源:未知 ? 作者:李倩 ? 2018-08-11 09:27 ? 次閱讀

編者按:近日,影視后期特效網(wǎng)站FXGuide在文章中介紹了一種用機(jī)器學(xué)習(xí)進(jìn)行3D實(shí)時渲染的新方法,在手機(jī)中安裝相關(guān)軟件后,用戶可以實(shí)現(xiàn)臉部即時卡通化,或是把自己的動態(tài)表情轉(zhuǎn)移到別人的臉上。這項(xiàng)技術(shù)來自AI創(chuàng)企Pinscreen,但不久前,它的首席執(zhí)行官/聯(lián)合創(chuàng)始人卻陷入了一場頗為轟動的學(xué)術(shù)丑聞……

SIGGRAPH是計(jì)算圖形學(xué)的年度頂級會議,發(fā)展至今,它已經(jīng)成為全球最負(fù)盛名的的CG展示、學(xué)術(shù)研討會——除了論文展示環(huán)節(jié),以電影、游戲?yàn)榇淼?a href="http://www.qldv.cn/v/" target="_blank">工業(yè)界也會爭相展示最新技術(shù),比如今年與會的暴雪娛樂和皮克斯,可想而知,它的熱鬧程度完全不亞于任何大型博覽會。

今年的SIGGRAPH將在8月12日召開,為期5天。作為計(jì)算圖形學(xué)最重要的會議,隨著近年來AI熱度的不斷上升,和計(jì)算機(jī)視覺一樣,SIGGRAPH的機(jī)器學(xué)習(xí)論文占比也屢破新高,這片圖形學(xué)的圣域大有“淪陷”趨勢。

而Pinscreen將在Real Time Live活動中展示的正是一項(xiàng)機(jī)器學(xué)習(xí)成果:paGAN。

學(xué)術(shù)造假丑聞

說到這家公司,就不得不提它的首席執(zhí)行官/聯(lián)合創(chuàng)始人——黎顥。這是個在南加州大學(xué)任教的華人教授,他是SIGGRAPH的常客,也曾被微軟學(xué)術(shù)搜索評為“過去5年計(jì)算機(jī)圖形學(xué)領(lǐng)域十大影響力學(xué)者”,在業(yè)內(nèi)有相當(dāng)?shù)?a target="_blank">知名度和威望。

黎顥

但二十幾天前,他的前雇員Iman Sadeghi博士卻向他發(fā)起指控。在遞交給法院的報告中,Iman Sadeghi列出了黎顥的幾大罪狀:1)用人工繪制圖像假冒AI作品,并在SIGGRAPH上展示“成果”;2)用技術(shù)“成果”欺騙投資人;3)惡意解雇并毆打Sadeghi博士。

這個消息立即在學(xué)界引起軒然大波,畢竟如此惡劣的學(xué)術(shù)不端行為還是很少見的。但隨著輿論持續(xù)發(fā)酵,一些關(guān)于Sadeghi博士的負(fù)面消息也出現(xiàn)了:1)入職后基本不工作,老是不見人影;2)試圖搶奪公司財(cái)產(chǎn),刪除重要數(shù)據(jù);3)毆打勸阻的女員工。

當(dāng)然,以上只是他們的一面之詞,最終結(jié)果還是要交給加州法院定奪。作為旁觀者,我們無需也無法作出判斷。綜觀此次Pinscreen的展示內(nèi)容預(yù)告,我們發(fā)現(xiàn)它和訴訟報告中提到的很不一樣,所以覺得有介紹的必要。至于這個成果是不是“造假”得來的,還有待時間檢驗(yàn)。

用paGAN實(shí)現(xiàn)3D實(shí)時渲染

在介紹技術(shù)前,我們先來看看paGAN的具體效果。

下圖的左側(cè)是FXGuide編輯Mike Seymour用iPhone拍攝的源視頻,右側(cè)是實(shí)時渲染CGI。可以發(fā)現(xiàn),Pinscreen的成果確實(shí)可以在同一源視頻上進(jìn)行數(shù)字化構(gòu)圖,為真實(shí)人臉生成3D數(shù)字掩模。除了混合邊緣上的小調(diào)整,整個過程已經(jīng)基本實(shí)現(xiàn)自動化。

在渲染過程中,皺紋等細(xì)節(jié)的處理通常比較困難。如上圖所示,雖然軟件沒能準(zhǔn)確重現(xiàn)每一條皺紋及其深淺程度,但右圖中的皺紋還是非常連貫,沒有出現(xiàn)參差錯落的情況。根據(jù)Pinscreen的說法,這些都是自動生成的。

上圖是Sadeghi博士在訴訟報告中展示的學(xué)術(shù)造假示例。據(jù)網(wǎng)友實(shí)驗(yàn),Pinscreen當(dāng)前版本的APP在處理肩部以下頭發(fā)時效果很差,對比Haley Dunphy那一頭金發(fā)(這是2017年提交給SIGGRAPH的成果),因此很多人認(rèn)為他提出的“頭發(fā)為人工制作”的說法是可信的。

但去年這個效果似乎和Mike Seymour的最新實(shí)驗(yàn)有很大差距,具體我們可以等新版軟件發(fā)布再去驗(yàn)證。

1. 用單張jpeg構(gòu)建面部

如果要生成卡通化的3D人臉,首先我們要構(gòu)建3D模型。Pinscreen現(xiàn)在使用的技術(shù)是基于單張Jpeg圖像構(gòu)建3D臉部模型,具體方法是靠“猜”,也就是先制作合理的3D網(wǎng)格,然后對輸入圖像和3D形狀執(zhí)行形狀匹配和角度變換。

事實(shí)上,除了Pinscreen,其他公司也用機(jī)器學(xué)習(xí)實(shí)現(xiàn)了這一技術(shù),它們的商業(yè)模式也基于這種創(chuàng)新。但Pinscreen的優(yōu)勢是處理效果更好,目標(biāo)更長遠(yuǎn)——開發(fā)直接面向用戶的端到端解決方案。

2. 每秒1000幀的臉部跟蹤

獲得模型后,下一步就是追蹤人臉位置和細(xì)節(jié)狀態(tài),保證模型的實(shí)時更新。據(jù)介紹,目前Pinscreen開發(fā)的最強(qiáng)大的臉部追蹤器是VGPT(Veli Goodo Pace Tracka),這也是他們即將在SIGGRAPH上實(shí)時演示的重要內(nèi)容。

VGPY是一個基于深度學(xué)習(xí)的輕量級網(wǎng)絡(luò),本身只有5M。不同于傳統(tǒng)追蹤器,它既不追蹤特征,也不追蹤標(biāo)記,而是基于直接推斷。具體而言,人類的臉部大同小異,以往我們使用的方法是在上面標(biāo)記一些關(guān)鍵特征點(diǎn),然后在統(tǒng)計(jì)的基礎(chǔ)上利用特征點(diǎn)來定位對齊。但根據(jù)黎顥介紹,VGPY使用的是3D高精度頭部模型、微表情測量工具FACS等工具,速度比AAM算法快很多。

這個追蹤器的速度也十分驚人。如果是在顯卡為1080P的PC上,VGPY的幀數(shù)高達(dá)1000;如果是在手機(jī)上,它的速度也有60到90 fps。雖然是快速無標(biāo)記追蹤,但VGPY可以始終保持高性能和高穩(wěn)健性。當(dāng)追蹤對象經(jīng)過遮擋物時,它會在短時間內(nèi)重新獲取面部并繼續(xù)工作。

3D人臉是左側(cè)圖像的,但臉部的動態(tài)是黎顥的(6個月前的成果)

3. paGAN

paGAN的全稱是Photoreal Avatar Generative Adversarial Network,它充當(dāng)整個系統(tǒng)中的“渲染器”。

渲染通常是繪圖的最后一步。就目前的傳統(tǒng)方法來看,如果我們要對頭像或人進(jìn)行建模、添加紋理、調(diào)節(jié)明暗和圖像渲染,大量高質(zhì)量數(shù)據(jù)是必須的。這通常意味著準(zhǔn)備多幅圖像,測量各個角度,進(jìn)行高質(zhì)量掃描,等到一切都準(zhǔn)備好,我們才能在3D網(wǎng)格上添加各種紋理、凹凸貼圖,鏡面反射貼圖等。除了著色器,我們還需要一個高質(zhì)量渲染算法。

雖然進(jìn)程安排存在先后,但上述內(nèi)容都息息相關(guān),而現(xiàn)實(shí)中承擔(dān)這些工作的通常是經(jīng)驗(yàn)豐富的工作人員和藝術(shù)家。這也意味著誰投入資源多,誰就做得好,這種由技術(shù)門檻帶來的不公平給電影、游戲工業(yè)帶去了不少困擾。

為了解決這個問題,Pinscreen團(tuán)隊(duì)跳過傳統(tǒng)方法,他們采取的第一種做法是不使用建模/紋理/照明和渲染管道,而是如下圖所示,直接將面部采樣點(diǎn)重新上色、復(fù)原、旋轉(zhuǎn)并放置在模擬的3D環(huán)境中,就像3D CGI頭一樣。

但這種方法失敗了,因?yàn)閺?fù)原的頭像無法正確定位,也不能完全動畫化。由于實(shí)際上只是把照片投影在匹配的幾何體上,它只能在靜態(tài)時實(shí)現(xiàn)高保真。

經(jīng)歷了失敗后,Pinscreen把目光轉(zhuǎn)向最先進(jìn)的深度生成模型——GAN。這是一種非常特殊的深度學(xué)習(xí)網(wǎng)絡(luò),它已經(jīng)被證明能生成逼真的2D圖像。黎顥和他的團(tuán)隊(duì)希望能用GAN代替?zhèn)鹘y(tǒng)做法,實(shí)現(xiàn)正確角度“渲染”。

GAN是Ian Goofellow于2014年提出的一種神經(jīng)網(wǎng)絡(luò),它包含一個生成器G和一個判定器D。其中G從潛在空間隨機(jī)采樣,把采樣得到的樣本作為輸入,目標(biāo)是輸出類似真實(shí)數(shù)據(jù)的數(shù)據(jù);而D的輸入是G的輸出,它負(fù)責(zé)鑒定這個生成的偽數(shù)據(jù)和真實(shí)數(shù)據(jù)像不像,然后把分類結(jié)果饋送給G,讓它積累“作假”經(jīng)驗(yàn)。

當(dāng)用于面部時,原始GAN的問題在于輸出的是個2D圖像,而且非常難控制。最后,Pinscreen團(tuán)隊(duì)做出了取舍,他們?yōu)閜aGAN制定的目標(biāo)是生成高度逼真的眼部和嘴部渲染。而根據(jù)最終結(jié)果,GAN確實(shí)在嘴部運(yùn)動和舌頭運(yùn)動上表現(xiàn)出色。

4. 重新定位

之前提到了,Pinscreen的3D臉部模型來自單張jepg,而它的表情則完全來自另一人,所以最后生成的表情動畫不會和jepg有什么外觀上的出入,十分自然,十分逼真。

如上圖所示,第一行是建模的圖像,第一列是表情來源,中間生成的表情都很自然。這里需要注意一點(diǎn),Pinscreen的人臉追蹤器VGPY只檢測了圖中亞洲男子的微表情,它沒有對靜態(tài)圖像jepg做任何掃描,這意味著這些富有表現(xiàn)力的表情都是直接從表情源直接轉(zhuǎn)移到目標(biāo)人臉上的。

其他細(xì)節(jié)

除了上文提到的內(nèi)容,黎顥也用自己積累的經(jīng)驗(yàn)做了不少優(yōu)化工作,比如paGAN面不僅能夠從任何角度“渲染”,也能根據(jù)所需的環(huán)境明暗條件進(jìn)行渲染。

提起訴訟的Sadeghi博士是毛發(fā)渲染領(lǐng)域的專家,但如果本文演示圖片屬實(shí),那么在他離職后,Pinscreen確實(shí)在頭發(fā)上也進(jìn)步明顯。而根據(jù)黎顥的說法,他的團(tuán)隊(duì)這次使用的是一個端到端的神經(jīng)網(wǎng)絡(luò)新系統(tǒng),可以始終根據(jù)訓(xùn)練數(shù)據(jù)生成合理的頭發(fā)模型。

看到這里,相信很多人已經(jīng)開始期待他們的新版APP。但大家請注意,以上圖像都是在PC上生成的,如果是手機(jī),效果會差那么一點(diǎn)兒。

這是軟件在手機(jī)上的效果,考慮到硬件差距,這個效果其實(shí)完全可以接受。

生成3D手機(jī)視頻聊天頭像

具體效果

而開發(fā)了這項(xiàng)技術(shù)后,Pinscreen首先瞄準(zhǔn)的目標(biāo)是實(shí)現(xiàn)3D視頻通訊。黎顥認(rèn)為,現(xiàn)如今3D游戲越來越多,而人們在其中扮演的也都是3D的角色,這說明3D是發(fā)展趨勢。未來,當(dāng)技術(shù)發(fā)展得足夠成熟后,也許打開手機(jī),我們面對不再是一個2D小人,而是一個立體化的真人形象。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 自動化
    +關(guān)注

    關(guān)注

    29

    文章

    5622

    瀏覽量

    79674
  • 計(jì)算機(jī)視覺
    +關(guān)注

    關(guān)注

    8

    文章

    1700

    瀏覽量

    46133
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8441

    瀏覽量

    133094

原文標(biāo)題:深陷官司丑聞,這個華人創(chuàng)業(yè)者要在SIGGRAPH上展示什么?

文章出處:【微信號:jqr_AI,微信公眾號:論智】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    為何PCB設(shè)計(jì)需要3D功能?

    (具有3個維度)創(chuàng)造產(chǎn)品,因此最佳的解決方法就是使用一種具有先進(jìn)的3D功能的設(shè)計(jì)工具。它可讓設(shè)計(jì)者在生產(chǎn)之前就能夠查看設(shè)計(jì)真實(shí)的3D圖像,不
    發(fā)表于 11-01 17:28

    3D掃描的結(jié)構(gòu)光

    耐用性。由于尺寸、冷卻和電池要求,系統(tǒng)設(shè)計(jì)將光通量和能效視為重中之重。 目前有很多對3D結(jié)構(gòu)光圖形進(jìn)行優(yōu)化的技術(shù)。其中個特別有效的方法就是自適應(yīng)圖形集。算法確定了圖形與波長的最佳組合
    發(fā)表于 08-30 14:51

    HDC2021技術(shù)分論壇:酷炫3D效果在瘦設(shè)備上也能實(shí)現(xiàn)

    過多的內(nèi)存和功耗。以3D壁紙為例,如果使用現(xiàn)在流行的商業(yè)渲染引擎來實(shí)現(xiàn),其內(nèi)存占用和功耗都很大。下面的圖1展示了款典型的2D靜態(tài)壁紙與其
    發(fā)表于 12-21 10:40

    京東方推出裸眼3D產(chǎn)品 可實(shí)時轉(zhuǎn)換2D3D畫面

    京東方聯(lián)合Stream TV推出來款8K裸眼3D產(chǎn)品,可實(shí)現(xiàn)電影,電視,游戲之間的裸眼3D轉(zhuǎn)化,有300檔的實(shí)時調(diào)節(jié)
    發(fā)表于 01-11 14:59 ?2951次閱讀

    開發(fā)以3D打印隨選制藥的新方法

    研究團(tuán)隊(duì),開發(fā)出化學(xué)數(shù)碼代碼和3D打印機(jī)制造藥物的新方法,該團(tuán)隊(duì)認(rèn)為,這種新方法將重新定義便攜式工廠模式。
    發(fā)表于 02-07 13:11 ?815次閱讀

    2D3D視頻自動轉(zhuǎn)換系統(tǒng)

    研究和實(shí)現(xiàn)個基于OMAP3530的2D3D視頻自動轉(zhuǎn)換系統(tǒng),重點(diǎn)研究深度圖獲取和深度信息渲染等主要核心技術(shù)及其
    發(fā)表于 03-06 14:20 ?1次下載
    2<b class='flag-5'>D</b>到<b class='flag-5'>3D</b>視頻自動轉(zhuǎn)換系統(tǒng)

    科學(xué)家正在研發(fā)3D打印人造器官的新方法

    哈佛大學(xué)的研究人員發(fā)明了一種3D打印人體組織的新方法,有朝日,這種方法可能會產(chǎn)生3D打印的人造
    的頭像 發(fā)表于 05-09 16:14 ?2368次閱讀

    AMD與Pixelary合作,創(chuàng)造了3D渲染照片

    今日 AMD 公布了組由最新的 Radeon ProRender 2.0 渲染渲染的梅賽德斯 F1 賽車的照片,展現(xiàn)了最新渲染器的效果。AMD 與設(shè)計(jì)公司 Pixelary 深入合
    的頭像 發(fā)表于 12-19 10:24 ?1770次閱讀

    HarmonyOS 3D渲染引擎介紹

    隨著3D技術(shù)的應(yīng)用普及,越來越多的場景都能看到3D的身影,比如充電動效、3D壁紙、游戲等等,給用戶帶來了更有趣、更豐富的體驗(yàn)。要滿足用戶的3D體驗(yàn)需求,離不開
    的頭像 發(fā)表于 12-23 09:49 ?4473次閱讀
    HarmonyOS <b class='flag-5'>3D</b><b class='flag-5'>渲染</b>引擎介紹

    NeuralLift-360:將野外的2D照片提升為3D物體

    3D點(diǎn)云中生成可渲染3D網(wǎng)格:使用個基于深度學(xué)習(xí)方法來將點(diǎn)云轉(zhuǎn)換為可
    的頭像 發(fā)表于 04-16 10:02 ?2222次閱讀

    3D渲染——光柵化渲染原理解析

    渲染進(jìn)行介紹,描述了簡單場景下3D渲染過程,主要幫助讀者了解基于光柵化的 3D 渲染原理及過程。
    的頭像 發(fā)表于 05-18 17:29 ?2398次閱讀
    <b class='flag-5'>3D</b><b class='flag-5'>渲染</b>——光柵化<b class='flag-5'>渲染</b>原理解析

    英偉達(dá)提出了同時對未知物體進(jìn)行6D追蹤和3D重建的方法

    一種用于新穎未知動態(tài)物體的因果 6 自由度姿態(tài)跟蹤和 3D 重建的新方法。該方法利用了并發(fā)跟蹤和神經(jīng)重建過程的新穎共同設(shè)計(jì),能夠在幾乎實(shí)時
    的頭像 發(fā)表于 07-03 10:49 ?522次閱讀
    英偉達(dá)提出了同時對未知物體<b class='flag-5'>進(jìn)行</b>6<b class='flag-5'>D</b>追蹤和<b class='flag-5'>3D</b>重建的<b class='flag-5'>方法</b>

    揭秘:實(shí)時渲染、離線渲染、云渲染和混合渲染的區(qū)別

    遇到這些概念,或者3D渲染引擎產(chǎn)品的時候,可以按照這些渲染分類,去快速的進(jìn)行定位和分析,更好的幫助我們理解和
    的頭像 發(fā)表于 12-26 08:27 ?910次閱讀
    揭秘:<b class='flag-5'>實(shí)時</b><b class='flag-5'>渲染</b>、離線<b class='flag-5'>渲染</b>、云<b class='flag-5'>渲染</b>和混合<b class='flag-5'>渲染</b>的區(qū)別

    介紹一種使用2D材料進(jìn)行3D集成的新方法

    美國賓夕法尼亞州立大學(xué)的研究人員展示了一種使用2D材料進(jìn)行3D集成的新穎方法
    的頭像 發(fā)表于 01-13 11:37 ?1138次閱讀

    VIVERSE 推行實(shí)時3D渲染: 探索Polygon Streaming技術(shù)力量與應(yīng)用

    在商業(yè)領(lǐng)域和娛樂行業(yè)中,3D渲染技術(shù)直是推動視覺體驗(yàn)革新的關(guān)鍵力量。隨著技術(shù)的進(jìn)步,實(shí)時3D渲染
    的頭像 發(fā)表于 05-31 15:49 ?2382次閱讀
    VIVERSE 推行<b class='flag-5'>實(shí)時</b><b class='flag-5'>3D</b><b class='flag-5'>渲染</b>: 探索Polygon Streaming技術(shù)力量與應(yīng)用
    百家乐园| 固始县| 百家乐1元投注| 百家乐官网博乐城| 百家乐官网游戏软件开发| 大发888娱乐城在线存款| 免费百家乐缩水| 百家乐最大的赌局| 百家乐必赢法软件| 百家乐游戏合法吗| 千亿娱百家乐官网的玩法技巧和规则 | 大发888娱乐场手机版| 全讯网12580a.com| 百家乐赌场| 易胜博投注| 龙博娱乐城| 皇冠足球现金网| 云顶国际娱乐网| 财神娱乐城打不开| 香港六合彩挂牌| 永胜县| 百家乐官网的保单打法| 百家乐官网视频软件下载| 网上赌百家乐官网正规吗| 百家乐官网室系统软件| 香港百家乐官网六合彩| 百家乐官网开户博彩论坛| 真钱百家乐官网五湖四海全讯网| 百家乐官网赌博网址| 澳门百家乐官网必赢技巧| 怎么赌百家乐官网能赢| 百家乐官网怎么玩会| 菲律宾百家乐的说法| 百家乐怎样出千| 全讯网六仔开奖| 六合彩图| 波音系列| 大发888 46| 皇冠网上69691| 百家乐官网黑牌靴| 蓝盾百家乐官网赌场娱乐网规则 |