那曲檬骨新材料有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

NVIDIA助力阿里巴巴天貓精靈大幅提升服務運行效率

NVIDIA英偉達企業解決方案 ? 來源:NVIDIA英偉達企業解決方案 ? 作者:NVIDIA英偉達企業解 ? 2022-07-14 10:05 ? 次閱讀

天貓精靈智能引擎團隊、智能合成團隊與 NVIDIA 團隊合作,通過利用 NVIDIA TensorRT 加速流式語音合成(Text-to-Speech,以下簡稱 TTS)深度學習模型,并借助 NVIDIA Triton 推理服務器在 NVIDIA T4 GPU 上進行高效部署,幫助阿里巴巴天貓精靈流式 TTS 服務將吞吐提升 50%,首包延時降低 35%,大幅提升服務運行效率,提升資源利用率。

天貓精靈(Tmall Genie)是阿里巴巴消費者人工智能一級公司,于 2017 年 9 月發布第一代天貓精靈智能終端 X1。讓用戶以自然語言對話的交互方式,實現影音娛樂、購物、信息查詢、生活服務等功能操作,成為消費者的家庭助手。目前,天貓精靈已經服務超過 3000 萬中國家庭,在三方權威統計中不僅智能音箱產品出貨量排名中國前列,其產品并已可連接 3 億以上的家庭 AIoT 生態設備。

除了智能音箱終端產品外,天貓精靈推出 AliGenie 開放平臺,旨在構建基于 AI 的多模態交互及服務系統,為多種云應用提供跨系統服務能力,實現端云協同、跨平臺多終端快速接入。該開放平臺提供高性能且高質量的語音 AI 能力,包括多種不同音色的高度擬人、高度流暢的語音合成算法等。

此外,天貓精靈基于 AliGenie 開放平臺,還提供基于芯片/模組的硬件解決方案,以及通用的熱門行業解決方案。專注生活多個領域,提供一站式解決方案。

本案例中負責實施的是天貓精靈智能引擎團隊以及天貓精靈智能合成團隊。天貓精靈智能合成團隊負責語音合成等生成式算法的研究及開發;天貓精靈智能引擎團隊主要支撐天貓精靈業務線各項業務的工程化落地,如語音識別、語義理解、語音合成、圖像處理等 AI 核心場景。

流式 TTS 是天貓精靈工作流中最為重要的 AI 環節之一。在這一場景中,天貓精靈智能引擎團隊面臨著如下挑戰:

首先流式 TTS 對于首包延時有著嚴格要求,否則用戶將會因為較長的反饋遲滯而感到不適,這就要求 TTS 工作管線的每個模塊的推理能夠高效地執行。

另一方面,團隊希望 TTS 服務的吞吐能夠達到較高水平,這就需要在服務端對收到的多個流式合成請求進行 Batching 的處理。但流式 TTS 工作管線包含聲學模型和聲碼器等多個模塊,在 GPU 上進行 Batching 操作需要正確維護和切換每個合成請求所需的模型狀態,因此需要特別設計工作管線和調度邏輯。

最后,如何盡可能提升 GPU 資源利用率是降本增效的關鍵。最直接的思路便是在一張 GPU 上部署多個模型來提升利用率。因此,如何在同一張 GPU 上對多個模型進行高效的調度和管理也成為了一個挑戰。

基于以上挑戰,天貓精靈智能引擎團隊、智能合成團隊與 NVIDIA 解決方案架構團隊合作,采用NVIDIA TensorRT對模型進行推理加速,并利用NVIDIA Triton 推理服務器在 T4 GPU 上進行在線部署,形成了一套高效的流式 TTS 推理部署方案。在提升用戶體驗的同時,大幅降低了服務成本。

首先,該方案使用 TensorRT 對流式 TTS 工作管線中的每一個模型進行優化加速。我們將訓練好的聲學模型和聲碼器,導出為 ONNX 模型格式,再使用 TensorRT 將 ONNX 模型轉換為最優化的 TensorRT Engine。使用 TensorRT 加速的 TTS 模型,能顯著提升推理執行的速度,從而盡可能壓縮首包延時。

另一方面,天貓精靈智能引擎團隊與 NVIDIA 團隊合作設計并實現了一種基于 Triton 的流式 TTS 推理部署管線。在該方案中,我們使用 Triton Custom Backend 實現串聯 TTS 各個模型的調度管線。對于管線中的每一步推理處理,會調用部署在 Triton 上的 TTS TensorRT Engine。如此一來,Triton 便可將發送到服務端的 TTS 請求,有條不紊地調度到管線中的每個模塊進行推理執行。并且,在該管線中,我們實現了適用于 GPU 平臺的流式 TTS 高效調度機制,通過在服務端 Custom Backend 中維護每個合成請求的狀態,實時地將模型輸入和狀態動態聚合為對 GPU 友好的 Batch,交由管線中各個模塊的 TensorRT Engine 進行推理,從而大幅提升管線吞吐和 GPU 利用率,同時保證了對每個合成請求的快速響應。此外,流式 TTS 中一句話的合成請求會對應多個回包,每個回包承載一個音頻塊。針對這種一收多發的推理模式,我們利用 Triton 提供的 Decoupled Responses 機制,保證一個請求的多個回包能夠正確高效地發送給對應的客戶端,使用戶能聽到完整且流暢的音頻。

最后,為了進一步提升 GPU 資源利用率,該方案利用了 Triton 的 Concurrent Model Execution 特性。該特性將部署在 Triton 上的模型或模塊,以模型實例的方式管理:一個模型可以部署多個實例,不同模型的實例也可部署在同一GPU上。因此該方案開啟了 Concurrent Model Execution 后,同一個 T4 GPU 上可部署多個 TTS 發音模型,使得多個模型實例的推理在 GPU 算力資源充足時可以達到并行執行。如此一來,GPU 算力資源可以被多個模型的并行執行充分利用起來,達到降本增效的目的。

通過使用基于 NVIDIA TensorRT 和 Triton 推理服務器的流式 TTS 推理部署方案,天貓精靈 TTS 服務的吞吐提升約 50%,首包延時降低約 35% ,幫助天貓精靈節省了業務成本,提升了用戶體驗。

審核編輯:湯梓紅
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    5076

    瀏覽量

    103719
  • 阿里巴巴
    +關注

    關注

    7

    文章

    1619

    瀏覽量

    47522
  • TTS
    TTS
    +關注

    關注

    0

    文章

    42

    瀏覽量

    10833
  • 天貓精靈
    +關注

    關注

    4

    文章

    96

    瀏覽量

    11443

原文標題:NVIDIA TensorRT 和 Triton 助力阿里巴巴天貓精靈顯著提升流式語音合成服務運行效率

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業解決方案】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    貓精靈與夸克團隊攜手設計AI眼鏡

    近日,阿里巴巴集團內部的智能互聯事業群迎來了新的管理變革,由總裁吳嘉正式接管這一關鍵業務板塊。作為阿里巴巴面向廣大消費者的重要硬件業務之一,“貓精靈”將繼續保持其獨立運營的特色與優勢
    的頭像 發表于 01-20 10:28 ?1031次閱讀

    阿里AI To C業務調整:貓精靈與夸克融合,探索AI眼鏡

    近日,阿里集團內部進行了一次業務調整,智能互聯事業群正式由智能信息事業群總裁吳嘉接管。智能互聯事業群是阿里在2022年成立的一級業務部門,其核心品牌為貓精靈,是
    的頭像 發表于 01-17 10:16 ?227次閱讀

    阿里巴巴出售高鑫零售股權,聚焦核心業務

    近日,阿里巴巴集團正式對外發布公告,宣布其子公司及New Retail與德弘資本達成了一項重要協議。根據該協議,阿里巴巴將出售其所持有的高鑫零售全部股權,這些股權合計占高鑫零售已發行股份總數的約
    的頭像 發表于 01-02 10:54 ?155次閱讀

    阿里巴巴74億出售銀泰百貨予雅戈爾

    近日,電子商務巨頭阿里巴巴集團宣布了一項重大決策,決定將旗下銀泰百貨的全部股權轉讓給由雅戈爾集團與銀泰管理團隊聯合組成的財團。這一消息引起了業界的廣泛關注。 據悉,此次交易涉及的金額高達74億元
    的頭像 發表于 12-18 10:04 ?236次閱讀

    阿里巴巴將在美國推出AI電商工具PIC COPILOT

    人工智能領域的一次重要嘗試,旨在利用先進的AI技術為美國電商市場提供更加智能化、便捷化的服務。該工具將深度融合阿里巴巴在大數據、云計算以及電子商務領域的深厚積累,通過智能算法和數據分析,幫助商家更加精準地把握市場需求,提升運營
    的頭像 發表于 12-06 10:52 ?472次閱讀

    阿里巴巴整合電商資源,成立全新電商事業群

    業群將由蔣凡擔任CEO,直接向吳泳銘匯報。該事業群將全面覆蓋并整合阿里巴巴旗下的淘寶貓集團、國際數字商業集團,以及1688、閑魚等核心電商業務。這一整合舉措旨在打造一個覆蓋國內外全產業鏈的綜合性業務集群,進一步提升
    的頭像 發表于 11-22 10:51 ?209次閱讀

    阿里巴巴國際站首推全流程AI產品

    近日,阿里巴巴國際站正式推出了其首個全流程AI產品——AI生意助手2.0。這一創新產品的問世,標志著阿里巴巴助力中小企業外貿經營方面邁出了重要一步。
    的頭像 發表于 10-30 16:12 ?307次閱讀

    阿里巴巴完成雙重主要上市

    8月28日阿里巴巴在香港聯交所主板主要上市,成為在港交所、紐交所雙重主要上市的公司。如今,阿里巴巴完成雙重主要上市。 此外,有投資機構認為阿里巴巴最快有望于9月份就納入港股通。 截至8月28日收盤,
    的頭像 發表于 08-29 16:06 ?412次閱讀

    阿里巴巴季報出爐 阿里云二季度營收增長6%

    阿里巴巴季報出爐我們一起來圍觀一下,根據阿里巴巴集團發布的截至2024年6月30日的第二季度經營業績數據顯示,阿里巴巴該季度營收達到2432.4億元,而上年同期營收2341.56億元,同比增4%;經
    的頭像 發表于 08-16 16:45 ?543次閱讀

    阿里巴巴AI賦能海外擴張新篇章

    中國電商巨頭阿里巴巴集團正積極重啟并加速其海外擴張戰略,以應對國內電商市場競爭加劇的挑戰。此次擴張的一大亮點在于,阿里巴巴將人工智能(AI)技術深度融入其國際業務布局中,開啟了海外發展的新篇章。
    的頭像 發表于 07-12 17:56 ?1060次閱讀

    阿里巴巴投資逐際動力,深化智能機器人布局

    近日,阿里巴巴集團對深圳逐際動力科技有限公司(簡稱:逐際動力)進行戰略投資,此舉再次體現了阿里巴巴在智能機器人領域的堅定布局。
    的頭像 發表于 05-22 11:52 ?870次閱讀

    阿里巴巴集團2024財年穩健增長

    阿里巴巴集團近日公布了其2024財年第四季度及全年業績報告,數據亮眼。在經歷一年的主動變革后,阿里巴巴重回健康增長軌道。
    的頭像 發表于 05-16 11:23 ?729次閱讀

    阿里巴巴杭州全球總部正式啟用

    近日,阿里巴巴在杭州的未來科技城正式揭開了其全球總部新園區的面紗。這座園區不僅是阿里巴巴目前規模最大的綜合性辦公空間,更是其綠色、科技、可持續發展理念的生動體現。
    的頭像 發表于 05-13 11:15 ?580次閱讀

    阿里巴巴減持小鵬汽車股份至9.24%

    據美東時間 3 月 20 日披露,小鵬汽車于美國證券交易委員會文件中透露,阿里巴巴旗下淘系平臺淘寶中國控股有限公司(Taobao China Holding Limited)正計劃出售 3300 萬份小鵬汽車 ADS,市值約為 3.14 億美元(約合人民幣 22.61 億元)。
    的頭像 發表于 03-21 10:45 ?776次閱讀

    阿里巴巴重返中國頂級電商軌道

    阿里巴巴集團董事會主席蔡崇信近日宣布,經過一系列架構重組和管理層變動后,阿里巴巴已成功重返中國頂級電商軌道。蔡崇信在講話中強調,公司正在逐步調整戰略,重新定位其在電商領域的領導地位。
    的頭像 發表于 02-27 14:29 ?970次閱讀
    百家乐星级游戏| 百家乐官网麻将筹码币| 缅甸百家乐官网网站| 百家乐扑克发牌器| 百家乐官网蔬菜配送公司| 百家乐官网的打法技巧| 韦德亚洲| 千亿娱百家乐的玩法技巧和规则| 百家乐官网单机破解版| 百家乐官网庄闲的分布| 新濠天地娱乐城| 大发888真钱游戏娱乐城下载| 百家乐游戏介绍与分析| 百家乐打庄技巧| 百家乐官网suncity| 百利宫百家乐官网现金网| 波音网址| 德州扑克读牌| 威尼斯人娱乐城会员开户| 百家乐api| 圣淘沙百家乐娱乐城| 362百家乐官网的玩法技巧和规则 大集汇百家乐官网的玩法技巧和规则 | 豪博百家乐官网现金网| 百家乐在线游戏| 大发888娱乐场lm0| 博E百百家乐的玩法技巧和规则| 赌百家乐的下场| 金花百家乐官网的玩法技巧和规则| 送彩金百家乐平台| 百家乐官网过滤| 百家乐官网大天堂| 百家乐官网网上投注系统| 百家乐官网游戏论坛| 扶余县| 盐亭县| 云顶国际| 大发足球| 百家乐官网赌博破解方法| 百家乐官网客户端软件| 百家乐官网视频中国象棋| 广平县|