那曲檬骨新材料有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

從“AI證件照”到“AI譯制片”,爆款AIGC應用的商業化迷思

腦極體 ? 來源: 腦極體 ? 作者: 腦極體 ? 2023-12-04 09:26 ? 次閱讀

讓郭德綱飆英文、讓霉霉說中文的翻譯視頻生成工具HeyGen和掀起AI證件照熱潮的“妙鴨相機”一樣,在一陣瘋狂刷屏之后,又迅速在各大群里銷聲匿跡了。

十月份,由HeyGen制作的各種明星跨語言翻譯視頻,在全網瘋傳,大家震撼于AIGC地道的中英文表達,完全沒有譯制片的腔調,惟妙惟肖的音色還原、高度對齊的口型聲音,讓不少人表示,“真的有被嚇到”“配音演員要失業了”……

太陽底下無新事,這個現象級AIGC應用,也逃不過“速朽”的命運。

如今我所在的LLM大模型討論群里,偶爾有人發一個中英翻譯視頻,根本無人討論,可能大多數人連點開看看,都提不起興趣。

大眾的新鮮感很快會過去,“明星譯制片”只有看個樂子的娛樂屬性,并不是高頻剛需,獵奇嘗鮮之后,到了真金白銀付費的時候,自然風過了無痕。

wKgaomVrS_GAD-zxAACuGTZHvMM181.jpg

這一年,大模型無疑是全球最大的熱點。但熱歸熱,最終在商業市場立足的大模型應用仍然稀少。

明明已經是“百模爭艷”,為何成功產品化的現象級應用,就那么幾個?

而這些產品成熟也不缺熱度的爆款AIGC應用,為何無法將流量轉化為持久的經濟效益,商業化仍是一團迷霧?

本文希望從“AI譯制片”這個小切口,探討一下大模型的產品化條件和商業化迷思。

一夜爆紅,是產品化的勝利

首先要明確一點,妙鴨也好,HeyGen也好,AIGC應用的一夜爆紅,對于大模型產業來說,絕對是一件正面的事。

大模型只是一種基礎技術,相當于鋼材,大模型廠商相當于煉鋼廠,還要有人設計出洗衣機、跑步機、微波爐等一個個具體的產品,新技術才能為人所用。

而HeyGen的一夜爆紅,正是產品化的勝利。

技術原理上,跨語言翻譯視頻制作并不是什么新事物,業內已經有很多科技公司、影視公司、后期制作公司在探索并推出了專業級工具平臺。

簡單來說,就是升級版的TTS(Text To Speech)技術。利用大語言模型對文本進行更地道的翻譯,然后對聲音空間進行更好的建模,訓練一個跨語種遷移TTS模型,讓風格遷移、音色遷移、情感遷移更加魯棒,合成的語音更加自然、還原。

這種技術的特點就是高效,整個翻譯過程全自動化,可以批量生成翻譯視頻。不過在自然度和表現力細節上,還是不如真人配音演員的演繹那么細膩、有創造力。

總結一下就是,HeyGen背后的技術原理,并非什么獨家秘籍。

其火爆的原因,是極高的產品化能力。

一般來說,AI技術的產品化,要經歷三個步驟:

第一步:選擇工具。

工欲善其事,必先利其器,工具是開發人員喜歡花費大量時間爭論的話題。HeyGen的工具選擇,是比較務實的,甚至看起來特別“小白”,那就是頭部閉源模型+開源“大禮包”。

有網友扒出,HeyGen是用Whisper將語音轉文字,GPT4(目前未開源)進行文本翻譯,聲音克隆+生成音頻用so-vits-svc,最后用GeneFace++,將翻譯后的語音與視頻中說話者的嘴唇動作同步。

大模型熱潮以來,我們看到了許多開發者在衡量和挑選“最好”的大模型,而市面上有各種不同的基座模型供應商,提供類似的競品服務,開發者想要找到絕對意義上最好的工具,幾乎不可能。這些底層工具如基座模型、編程語言等,先進性都可能變化。選擇好相對較優的工具組合,然后快速去開發demo、驗證想法、迭代升級,才是開發者最應該做的。

wKgaomVrS_KAFgeRAABDafFfOl4527.jpg

第二步:原型設計。

HeyGen選擇的工具,無論是GPT4的API,還是開源模型,都是比較容易獲取的,但大多數普通人都不會從搜索GitHub倉庫、處理軟件bug中獲得多少樂趣。

就拿跨語種視頻翻譯來說,其中涉及了多模態內容的翻譯,包括語音、文本以及視頻,在字幕翻譯、語音合成、智能配音方面,目前都有很好的自動化,但將多模態功能集成到一起,實現端到端一鍵翻譯的產品還不多見。

所以,HeyGen構建了一個簡單易上手的訪問界面,通過集成多種模型、多種工具,降低了翻譯門檻,用戶只需要上傳初始視頻-選擇目標語言-一鍵輸出,就可以坐等聲音克隆完成了。

HeyGen的核心價值,就是讓非技術用戶不必陷入繁多的技術細節中,不需要安裝N多個額外的工具,就可以與多個模型交互,完成轉寫、翻譯、配音、圖像處理、音畫同步等一大堆復雜的事情,輕松進行高維度、可交互的內容創作。

wKgZomVrS_KAZIisAABFchkoYxs110.jpg

第三步:產品化。

明星、名人的跨語言翻譯視頻固然精彩,但只是一種用例,并且只能停留于C端用戶玩梗,涉及自然人的聲音、肖像等版權問題,是無法大規模普及并商用的。所以,雖然明星譯制片帶火了HeyGen,但HeyGen想要將產品投放市場并發揮價值,還需要更有說服力的產品力。

從HeyGen官網可以看到,數字人+跨語言翻譯視頻,才是HeyGen的核心產品力,并給出了跨境電商營銷視頻、跨語種品牌宣傳、老師制作教學視頻、社交媒體吸粉、為生日婚禮等紀念日制作令人難忘的個人視頻等,一系列落地場景。

在此基礎上,HeyGen讓數字人跨語言翻譯視頻,可以通過自動化流水線來制作。

用戶可以上傳自己的照片,進行個性化形象定制,也可以在HeyGen提供的數字人素材和模板中選擇,輸入腳本后就能生成自己所需的多語種視頻了。

wKgaomVrS_OAXBLNAAGNo7QhZiA280.jpg

至此, HeyGen順利完成了AI譯制產品化的轉換,從而取得了巨大的成功,導致了“多年譯制無人問,一朝HeyGen天下知”的景況。

從AI寫真到AI譯制片的爆火,一次次說明,產品化是承上啟下、不可或缺的一步,再怎么強調也不為過。

可以肯定地說,不能完成從技術到原型設計再到產品化的轉換,將是許多大模型投資回報率低的主要原因,也是許多AI創業項目失敗的原因之一。

難逃“速朽”命運,商業化的魔咒

然而,即便如此成功的產品化,HeyGen又一次重復了“妙鴨”前輩的故事,在訪問量陡增之后,又很快在各大群里銷聲匿跡了。

公域流量的退潮,似乎是爆款AIGC應用的共同命運。

對此,有人認為,HeyGen是在“悶聲發大財”。雖然獵奇玩家散去了,但留下來的用戶還是給HeyGen貢獻了收入增長,HeyGen連續九個月環比增長率在50%以上。創始人Joshua Xu也在社交媒體上公布了相關數據,僅七個月時間,ARR年度經常性收入就達到了100萬美元。

問題來了,HeyGen的商業化潛力是可持續的嗎?

wKgZomVrS_OAePZYAAB_azYbi6c225.jpg

我們認為,HeyGen將要面臨的商業化挑戰,還是非常大的。

首先,技術工具無法被壟斷,僅靠多模態AI無法建立商業模式。

HeyGen憑借大模型強大的多模態和理解能力,讓跨語種翻譯視頻制作,達到了傳統AI譯制所望塵莫及的水平,這是非常厲害的工作。但大模型就像c++、數據庫一樣,只是一種新技術工具,它是無法被壟斷的。HeyGen所使用的開源工具極易獲得,閉源模型API也敞開了迎客,所以僅靠底層工具無法建立商業模式和競爭壁壘。

而產品創意、交互界面的開發門檻并不高,大量科技企業和個人開發者都可以輕松復刻并優化升級,產品被超越或許只在旦夕之間。

如今點開海外科技媒體的報道頁面,會看到類似HeyGen(原movio)的視頻生成工具,推薦清單高達95個之多。可以說,HeyGen提供了一個寶貴的AIGC用例,但很快就開啟了一場白熱化競爭,這對其后續收入的持續增長是很大的威脅。

wKgaomVrS_SASVnYAAFdWOknBtY278.jpg

其次,C端付費剛性,B端行業壁壘深,收入增長曲線會放緩。

目前,HeyGen收入主要靠C端客戶付費。免費版本只支持一個免費的credits字幕,顯然僅供玩票,而最低的創作者(Creator)付費檔也要24美元/月,對于個人博主來說雖然不算太貴,但隨著一大堆同質化產品的價格“內卷”,未來也會面臨性價比不高的窘況。

wKgZomVrS_SAFAJEAABKwd5w2eg775.jpg

而商業用戶(business)雖然付費能力強、價格接受度高,但對跨語言視頻翻譯的技術含金量則要求更為復雜。將HeyGen商業版本的客戶,大多是制作電商營銷廣告、語言學習數字人、多語種新聞播報、譯制片等,對翻譯質量就會提出更為細粒度的要求,比如文本翻譯的長度,要盡量和目標語言接近,來保持說話口型的一致性。還有,不同人說話的韻律不一樣,停頓的位置、重音的位置都要對齊,才能高度還原個人風格。

再比如,老人、小孩說同一個文本時,因為角色人設的不同,遣詞造句也應該不一樣,翻譯后的文本、語音都需要跟人設相對齊。

還有很多文化細節,是跨語種翻譯中要進行強把控的,很多還是要人工譯者去完成。畢竟商用場景不同于娛樂場景,跨語言容易產生歧義,一旦出現1%的錯誤,都可能讓做對的99%工作打了水漂,面臨丟單甚至海外市場合規風險。

所以說,商業用戶需要復雜、高質量、高控制的產品。這就需要廠商在數據方面,尤其是小語種等少樣本數據,有獨家的、高質量的數據積累。模型訓練,強行業知識等,都要長期積累和迭代,達到專業譯者的水平。

目前,已經有AI公司針對精品化視頻譯制的需求,推出了ToB的產品解決方案,訓練跨語種 Voice Conversion模型,采集配音演員的口型,由人工控制,再經由VC模型生成配音結果,比TTS模型的表現力更強,細節保留更多。

目前國內的AI巨頭都很重視B端市場,資源充足,并且在機器翻譯TTS、多模態AI技術方面的積累深厚,都可能是HeyGen商業用戶的爭奪者。

大模型的產品創新風口,才剛剛開始,要保持商業化的優勢身位,如逆水行舟,“當紅頂流”也不能掉以輕心。

爆款應用“速生速朽”,大模型的商業迷思

2022年11月30日,ChatGPT問世,在一周年剛剛過去之際,這場大語言模型的熱潮,將所有人都席卷其中。或許還有人無知無覺,但也注定無法置身事外。

一年以來,時常有妙鴨相機、HeyGen這樣的爆款應用,在社交媒體刷屏。這證明了幾件事:

1.大模型是條件,而不是結果。運用好這些新工具,創造新產品的人,會獲得新時代里無限多的機會。

2.基建是問題,但也不是問題。提到大模型,業界總會擔憂算力卡被限制,國產大模型能力有差距,但悲觀者正確,樂觀者前行。實際上,無論算力基建、開發工具、基座模型,在今天都不是,也不該是應用開發者的阻礙。

業內有人說過,國產卡只要達到N卡60%的性能,用戶就會買單。而一些開發者告訴我,密集使用了文心一言、訊飛星火等國產大模型,基礎邏輯推理確實能叫板GPT 3.5-turbo,非基礎能力比如func call、穩定性等也可圈可點。而妙鴨、HeyGen也都是中國企業所開發的,行動比洞見更重要。

3.產品化,是大模型商業化的必要條件。做了那么多通用大模型和行業大模型,如果沒有大量產品化的成果,是無法轉化為使用價值和經濟效益的。“改變世界”的不是大模型,而是各種各樣的產品,無數個HeyGen,幫助開發者完成從原型設計到產品化的轉換,降低試錯成本,將是接下來大模型廠商最重要的動作。

4.建立商業壁壘的,是剛需場景+強業務知識/數據+軟件工程。HeyGen的商業化挑戰,說明大模型不是壁壘,產品也不是壁壘,這些都是很容易被復制的。而行業知識/數據,大規模軟件工程的流程控制、降本增效,可以針對特定場景的需求深入挖掘、快速開發、快速迭代優化,才符合AI技術特性,才是商業化的保障。

幾位行業大模型應用的開發者,不約而同地跟我說過一件事:先找到場景,再優化產品和服務。也就是先想好商業變現的路線,確定自己的壁壘達到了,再去扎扎實實做產品,心里才能不慌。

比如一個ToC的民宿大模型,解決的是旅客入住民宿時,管家介入太深顯得沒有邊界感,過度打擾;管家介入太淺,又缺乏服務價值感,無法及時解決問題。基于大模型的語音交互助手,就在旅客和管家之間,起到了很好的緩沖橋梁作用,讓服務恰到好處。而旅客在當地的餐飲、游玩、購物等活動,也都是圍繞“住”展開的,通過民宿大模型提供優質可靠的推薦服務,也帶來了商業轉換的潛力。

一個ToB的金融大模型應用開發者也表示,企業機構內部的多樣化需求,是不可能由一個通用的、標準化的軟件產品來承載的,所以ToB大模型創業,既要做業務分析咨詢,又要做軟件開發寫代碼,才能真正服務好客戶。AI軟件開發的流程化、自動化,對于控制成本非常重要,不能每個項目都靠一群博士“手搓”代碼。

對商業和場景的深刻洞察,對行業和客戶的理解,比掌握算法、掌握技術都要難得多,也是開發者最應該重視的核心能力。

最后我想說,雖然大模型已經非常火了,但別急著擔心“泡沫”、害怕“追高”,這才是開始。

國際咨詢機構的調查報告顯示,65%的受訪者目前有時或很少使用生成式人工智能,而約占90%的受訪者認為,AI應該被“經常或總是”使用。

也就是說,大眾對機器學習和生成式 AI (gen AI)的接受度很高,而實際滲透率并不高。妙鴨、HeyGen等現象級Gen AI產品,無疑邁出了一大步,而只有它們,是遠遠不夠的。

爆款AIGC應用,只是AI和大模型價值潛力的一小部分。目前還沒有一種商業模式長期跑通,恰恰說明技術的新大陸上,留給登陸者、建設者們的發揮空間還很大。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    87

    文章

    31511

    瀏覽量

    270304
  • AIGC
    +關注

    關注

    1

    文章

    367

    瀏覽量

    1604
  • 大模型
    +關注

    關注

    2

    文章

    2545

    瀏覽量

    3161
  • 生成式AI
    +關注

    關注

    0

    文章

    514

    瀏覽量

    547
收藏 人收藏

    評論

    相關推薦

    免費時代到來!價格戰帶領AI大模型走出商業化困局?

    試用。 ? 大模型進入免費時代 ? 5月21日,阿里云宣布通義千問4商業化模型和5開源模型大降價,其中GPT-4級別的主力模型Qwen-Long價格直降97%,從此前API輸入0.02元/千
    的頭像 發表于 05-23 09:09 ?2702次閱讀
    免費時代到來!價格戰帶領<b class='flag-5'>AI</b>大模型走出<b class='flag-5'>商業化</b>困局?

    #新年新氣象,大家新年快樂!#AIGC入門及鴻蒙入門

    、配置SDK等。 3. 開發實踐**: 學習鴻蒙系統的架構和API,了解其組件、分布式等特性。 通過官方文檔和社區資源,學習和掌握鴻蒙應用的開發流程和技巧。 總結來說,AIGC作為一項結合了人工智能
    發表于 01-13 10:46

    AIGC入門及鴻蒙入門

    JDK、配置SDK等。 3. 開發實踐: 學習鴻蒙系統的架構和API,了解其組件、分布式等特性。 通過官方文檔和社區資源,學習和掌握鴻蒙應用的開發流程和技巧。 總結來說,AIGC作為一項結合了
    發表于 01-13 10:32

    華為云 Flexus X 實例部署安裝 HivisionIDPhoto 一個輕量級的 AI 證件照制作算法

    背景 最近有一個開源項目非常火,就是 HivisionIDPhotos 一個輕量級的 AI 證件照制作算法 github 倉庫 https://github.com/Zeyi-Lin
    的頭像 發表于 12-25 17:08 ?184次閱讀
    華為云 Flexus X 實例部署安裝 HivisionIDPhoto 一個輕量級的 <b class='flag-5'>AI</b> <b class='flag-5'>證件照</b>制作算法

    手機行業AI競賽步入新階段:顛覆體驗提升

    自去年以來,手機行業掀起了一場生成式人工智能(AIGC)的競賽熱潮,各大廠商紛紛加大AI技術的研發力度。然而,經過近一年的發展,AI手機已逐漸初期的盲目發力轉向理性認識與合理利用生成
    的頭像 發表于 10-23 11:36 ?386次閱讀

    AI for Science:人工智能驅動科學創新》第4章-AI與生命科學讀后感

    了傳統學科界限,使得科學家們能夠更加全面和深入的角度理解生命的奧秘。同時,AI技術的引入也催生了一種全新的科學研究范式,即數據驅動的研究范式,這種范式強調大量數據中提取有價值的信息,從而推動科學研究
    發表于 10-14 09:21

    AIGC產業聯盟在京成立,共促AI內容創新應用

    在第二十七屆北京·香港經濟合作研討會上,石景山區專題推介活動亮點紛呈,其中AIGC產業聯盟的正式成立尤為引人注目。該聯盟匯聚多方力量,旨在通過構建資源共享、技術交流與合作平臺,為AI生成內容(AIGC)技術打造蓬勃發展的創新生態
    的頭像 發表于 09-25 15:55 ?388次閱讀

    蘿卜快跑火的背后,美格智能如何助力無人車商業化

    無人車商業化進程已經邁入加速賽,美格智能將繼續堅持研發投入,與產業伙伴共同構建面向智能汽車產業的新質生產力,助力無人車商業化加速發展!
    的頭像 發表于 07-16 16:39 ?522次閱讀

    蘿卜快跑火的背后,美格智能如何助力無人車商業化

    無人車商業化進程已經邁入加速賽,美格智能將繼續堅持研發投入,與產業伙伴共同構建面向智能汽車產業的新質生產力,助力無人車商業化加速發展!
    的頭像 發表于 07-16 16:37 ?1344次閱讀
    蘿卜快跑<b class='flag-5'>爆</b>火的背后,美格智能如何助力無人車<b class='flag-5'>商業化</b>?

    談談創意設計中的AI、AGI、AIGC

    在當今的數字化時代,創意設計領域正經歷著前所未有的變革。隨著人工智能(AI)、通用人工智能(AGI)以及人工智能生成內容(AIGC)的迅猛發展,設計師們的工作方式和創作手段都發生了深刻的變化。本文
    的頭像 發表于 07-01 18:20 ?835次閱讀
    談談創意設計中的<b class='flag-5'>AI</b>、AGI、<b class='flag-5'>AIGC</b>

    聚焦AI技術引領,智象未來全面賦能圖片及視頻內容生產

    當前,AIGC浪潮不斷席卷各行各業,隨著其技術的不斷釋放,全新行業價值正在顯現,AI技術也在從產業應用向社會應用轉變,深刻影響著產品創新、內容創作及
    的頭像 發表于 06-24 13:36 ?369次閱讀
    聚焦<b class='flag-5'>AI</b>技術引領,智象未來全面賦能圖片及視頻內容生產

    大模型產品,不過是三支舞

    AI產品的答案,才是AI商業化的起點
    的頭像 發表于 06-13 09:27 ?1993次閱讀
    大模型產品<b class='flag-5'>化</b>,不過是三支舞

    NanoEdge AI的技術原理、應用場景及優勢

    等領域。以下是一些具體的應用場景: 1 . 智能家居:通過將 NanoEdge AI 集成智能家居設備中,可以實現對家庭環境的實時監控和智能控制,如溫度調節、照明控制、安防監控等。 2.工業自動
    發表于 03-12 08:09

    努比亞Flip 5G折疊屏手機證件照首曝,即將國內發售

    近日,匿名科技公司于MWC2024上發布的努比亞Flip 5G折疊屏手機已在工業和信息部網站上展示出其證件照片,預示著此款新品將在國內市場即將推出。
    的頭像 發表于 02-29 14:22 ?883次閱讀

    微軟攜手法國AI初創企業Mistral推動AI模型商業化

    微軟近日與法國人工智能初創企業Mistral達成合作協議,旨在推動AI模型的商業化應用。據悉,微軟將提供全方位支持,幫助這家成立僅10個月的公司將其先進的AI模型推向市場。同時,微軟還將持有Mistral的少量股份,但具體的財務
    的頭像 發表于 02-28 10:23 ?612次閱讀
    洞口县| 百家乐最好投注法是怎样的去哪儿能了解一下啊 | 博彩百家乐五2013124预测| 状元百家乐的玩法技巧和规则| KTV百家乐的玩法技巧和规则 | 百樂坊百家乐官网的玩法技巧和规则| 明珠百家乐官网的玩法技巧和规则| 百家乐官网缩水软件| 百家乐最稳妥的打法| 百家乐旺门打法| 老虎机定位器| 六合彩免费图库| 千亿娱百家乐的玩法技巧和规则| 威尼斯人娱乐城官方地址| 博彩行业| 百家乐官网下注稳赢法| 百家乐官网桌布专业| 新锦江百家乐官网的玩法技巧和规则 | 网络百家乐官网真假| 线上百家乐官网手机版| 女神百家乐官网的玩法技巧和规则 | 百家乐高手论| 皇冠在线娱乐城| 百家乐官网娱乐城地址| 神话百家乐官网的玩法技巧和规则 | 大发888洗码| 线上娱乐城| 澳门百家乐官网破解方法| 金道百家乐游戏| 任你博百家乐的玩法技巧和规则| 88娱乐城开户| 百家乐官网游戏世界视频| 百家乐官网德州| 捷豹百家乐的玩法技巧和规则 | 百家乐官网优惠高的网址| 百家乐官网技巧平注常赢法| 老虎百家乐的玩法技巧和规则| 上游棋牌大厅下载| 澳门百家乐官网会出老千吗 | 百家乐乐百家娱乐场| 松原市|