那曲檬骨新材料有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

研究自然語音交互系統帶來人機對話新體驗

bNZh_Ali ? 來源:AliOS ? 作者:AliOS ? 2021-05-19 14:16 ? 次閱讀

不難發現,現在「車載語音交互」的體驗越來越完善。它不僅能完成更多的指令,而且能和我們進行情感交互,甚至還懂得一些基本的倫理綱常。AI語音交互,同樣正在占據我們生活應用中的每一個入口,現在,被視作“第三空間”的汽車場景,通過自然連續對話完成人車之間的主動交互,正在成為現實。

回顧發展之初,車載語音雖然能完整跑通 ASR、TTS 這些流程,能實現一些簡單的 NLU/NLP 能力,但體驗有很多漏洞,比如有可能識別失敗,指令完成緩慢,交互邏輯不合常理等等。如今來看,這些基礎能力正變得更強,基本可以稱得上是一個「有價值的工具」。

另一方面,語音交互作為智能網聯汽車的“靈魂”,一直是車聯網公司和主機廠發力的重點領域。目前市面上常見的車載系統每次交互都得說出喚醒詞,無法做到自然連續對話。相比市場同類車載系統,基于AliOS底層技術開發的斑馬智行VENUS系統,在AI語音功能智能化程度上有了更高突破,不僅具備人類親和力的特質和邏輯思維能力,同時,整個對話體驗更加自然流暢,能帶給用戶更具情景化、更有溫度的用車體驗。

實際上,新斑馬語音產品在快、準、自然的交互體驗基礎上,開創了全雙工、全場景、全閉環的交互特色,并第一次在車內實現了個性化聲音克隆的技術。

語音基礎能力方面,新斑馬語音背靠阿里巴巴達摩院,提供ECNR、VW、ASR、TTS等全鏈路語音基礎能力,并且在汽車語義上投入重兵與達摩院合作共建,保障在核心能力上的領先性和特色。

語音交互特性方面,重點演進了全雙工交互能力,并且開發了可見即可說、全時喚醒、靈動喚醒詞、多TTS引擎、雙模態交互、個性化聲音克隆等交互特色。其中聲音克隆技術可以將用戶的聲音復制到車內,提供更加個性化的趣味體驗。

同時,在與車場景結合方面,斑馬語音擁有全場景、全閉環的交互體驗。在地圖導航、多媒體、通訊、車控車設四大場景上進行了深度挖掘,與語音進行深度結合,實現動口不動手的語音交互體驗。同時為支付寶車載小程序開放平臺提供語音開放能力,讓接入汽車的支付寶車載小程序都可以使用語音進行交互。

自然語音交互系統- 全雙工交互技術

一次喚醒多次輸入

更高效更接近人類交互習慣

基于場景的上下文預測

邊說邊聽,邊聽邊想

全雙工交互具有一次喚醒多次輸入、邊說邊聽邊聽邊想、基于場景進行上下文預測等能力。相比傳統語音交互方式,全雙工更接近人類習慣,是語音交互到自然交互的必備階段。

實現全雙工語音交互,面臨著多項技術挑戰:如何在機器說話的同時清楚地接收用戶說話的信號?如何保證持續不斷地接收用戶完整的信息表達?如何在保證準確理解的前提下控制誤觸發?這些問題在汽車環境中會被不斷放大,阻礙技術的落地應用。

斑馬依托達摩院降噪、回聲消除、流式ASR、流式NLU、專項NLU拒識模型等前沿技術,在大規模實車數據的訓練下,實現了真正的全雙工交互技術在車內的大規模使用。

自然語音交互系統- 聲音克隆技術

基于深度神經網絡

快速生成TTS聲音模擬

個性化自然交互體驗

讓最熟悉的聲音一路相伴

聲音克隆技術只需要提取用戶5-10分鐘的聲音片段,就可以提取出他的聲音特征,進而訓練出和他的聲音相似的TTS聲音。傳統的TTS技術需要獲得幾十小時的數據才能夠進行TTS的發音人訓練。而基于深度神經網絡,斑馬聲音克隆系統在5-10分鐘的聲音片段中,就可以通過聲音特征提取訓練、聲音合成器訓練和聲碼器訓練完成TTS聲音的模擬。

聲音克隆技術在車內可以為你帶來更加個性化的自然交互體驗,你可以把車內的聲音設置成自己的愛人、子女、父母等親人的聲音,為自己的行車生活增添更多的溫暖。

有了聲音及語意上的天然優勢,再加之AI大數據的后端支持,斑馬智行VENUS實現了“智商情商雙進步,聊啥都懂”的突出能力。具體來看,斑馬智行VENUS AI語音技能將覆蓋500多個常用知識領域,無論是查天氣、查股票,還是幽默段子,都能“隨問隨答”。

隨著5G物聯網自動駕駛等技術的成熟,車載語音助手必然會替代我們現有的人車交互方式,一款好的車機語音對汽車而言,顯得尤為重要。在近日對外透露的斑馬5計劃中,「對話式導航」將成為下一項語音交互黑科技。不久的將來,影視劇中如霹靂游俠那般的人車對話也終將會實現。

編輯:jq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 物聯網
    +關注

    關注

    2914

    文章

    44938

    瀏覽量

    377074
  • ASR
    ASR
    +關注

    關注

    2

    文章

    43

    瀏覽量

    18804
  • 5G
    5G
    +關注

    關注

    1356

    文章

    48506

    瀏覽量

    566027
  • 自動駕駛
    +關注

    關注

    785

    文章

    13932

    瀏覽量

    167015

原文標題:自然語音交互系統 帶來人機對話新體驗

文章出處:【微信號:AliOS,微信公眾號:AliOS】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    清華牽頭深開鴻參與:混合智能人機交互系統獲批立項

    攻關任務,由工業和信息化部主責推進。 該項目的目標是研發一套面向混合智能的自然人機交互軟硬件系統,旨在提升人機交互自然性、智能性和高效性。通過結合清華大學在人工智能、
    的頭像 發表于 01-23 16:33 ?341次閱讀

    啟英泰倫新推出多意圖自然說,重塑離線人機交互新標準!

    智能語音識別技術作為人機交互領域的一場革命性突破,正逐步重塑我們與智能設備的交互方式。近期,啟英泰倫新推出了多意圖自然說技術,進一步增強了人機交互
    的頭像 發表于 01-03 16:01 ?185次閱讀
    啟英泰倫新推出多意圖<b class='flag-5'>自然</b>說,重塑離線<b class='flag-5'>人機交互</b>新標準!

    語音芯片賦能可穿戴設備:開啟個性化音頻新體驗

    語音芯片與可穿戴設備合作,帶來定制化音效、智能降噪、個性化推薦、語音交互及跨設備共享等,引領個性化音頻時代,提升用戶聽覺體驗。
    的頭像 發表于 12-14 15:44 ?515次閱讀

    語音識別與自然語言處理的關系

    人機交互的革命,使得機器能夠更加自然地與人類溝通。 語音識別技術概述 語音識別,也稱為自動語音識別(ASR),是指將人類的
    的頭像 發表于 11-26 09:21 ?589次閱讀

    具身智能對人機交互的影響

    在人工智能的發展歷程中,人機交互一直是研究的核心領域之一。隨著技術的進步,人機交互的方式也在不斷演變。從最初的命令行界面,到圖形用戶界面,再到現在的自然語言處理和
    的頭像 發表于 10-27 09:58 ?446次閱讀

    海思星閃指向遙控引領電視大屏智慧交互新體驗

    星閃生態今天迎來一個值得紀念的時刻——星閃指向遙控在卡薩帝發布會“思享薈”上隆重發布。這一創新成果標志著卡薩帝與海思的聯合創新達到了新的高度,首次將星閃的高精度定位技術應用于智慧家庭場景,引領電視大屏智慧交互新體驗。這不僅是星閃技術在應用層面的又一次重大突破,也為正在蓬勃
    的頭像 發表于 10-22 11:28 ?788次閱讀

    科大訊飛發布星火極速超擬人交互,重塑智能對話新體驗

    8月19日,科大訊飛震撼宣布了一項關于其明星產品——星火語音大模型的重大革新,即將推出的“星火極速超擬人交互”功能,預示著人機交互的新紀元。該功能定于8月30日正式登陸訊飛星火App,面向廣大用戶開放體驗,引領一場前所未有的智能
    的頭像 發表于 08-20 16:46 ?397次閱讀

    樂鑫聲學前端算法:打造智能語音交互新體驗,ESP32-S3 SOC技術方案

    隨著人工智能技術的不斷進步,智能語音設備正逐漸成為我們生活中不可或缺的一部分。然而,在嘈雜的現實環境中,如何實現清晰、準確的語音交互,一直是業界面臨的一大挑戰。今天,我們要介紹的是樂鑫聲學前端算法
    的頭像 發表于 08-03 08:04 ?1136次閱讀
    樂鑫聲學前端算法:打造智能<b class='flag-5'>語音</b><b class='flag-5'>交互</b><b class='flag-5'>新體驗</b>,ESP32-S3 SOC技術方案

    OpenAI提前解鎖GPT-4o語音模式,引領對話新紀元

    OpenAI近日宣布了一項令人振奮的消息:即日起,部分ChatGPT Plus用戶將率先體驗到GPT-4o的語音模式,這一創新功能標志著自然語言處理與人工智能交互技術邁出了重要一步。GPT-4o的高級
    的頭像 發表于 08-01 18:24 ?1271次閱讀

    疆程技術亮相2024汽車軟件與通信大會,智能顯示引領駕乘新體驗

    疆程技術亮相2024汽車軟件與通信大會,智能顯示引領駕乘新體驗
    的頭像 發表于 05-30 09:59 ?486次閱讀
    疆程技術亮相2024汽車軟件與通信大會,智能顯示引領駕乘<b class='flag-5'>新體驗</b>

    智能語音交互技術如何助力設備實現人機自然對話

    隨著現代人工智能在各行業的普及,智能語音交互技術也越來越多的在日常工作、生活中應用,智能語音交互的出現不僅僅大量節省了人工的工作時間提高了工作效率,為人們工作生活
    的頭像 發表于 05-23 15:16 ?768次閱讀
    智能<b class='flag-5'>語音</b><b class='flag-5'>交互</b>技術如何助力設備實現<b class='flag-5'>人機</b><b class='flag-5'>自然</b><b class='flag-5'>對話</b>

    智能語音交互技術如何助力設備實現人機自然對話

    智能語音交互技術是指通過語音識別、語音合成和自然語言理解等技術,實現人與機器之間自然語言的交流和
    的頭像 發表于 05-23 15:14 ?430次閱讀

    訊維智能可視化綜合平臺:打造高效遠程會議的新體驗

    訊維智能可視化綜合平臺在遠程會議領域帶來了前所未有的新體驗,它通過高度集成化的技術和創新設計,為遠程會議參與者提供了高效、便捷、直觀的交流方式。以下是訊維智能可視化綜合平臺如何打造高效遠程會議新體驗
    的頭像 發表于 05-11 16:37 ?384次閱讀

    **十萬級口語識別,離線自然說技術,讓智能照明更懂你**

    NLP技術。該技術基于端到端語音識別技術及端側NLP技術,可識別端側十萬級別口語說法,打破傳統的固定詞條語音識別,為用戶提供更自然、更靈活、更智能的語音
    發表于 04-29 17:09

    人機交互的三個階段 人機交互的常用方式

    交互經歷的三個階段:命令行界面交互階段、圖形用戶界面交互階段、自然和諧的人機交互階段。
    的頭像 發表于 03-13 17:25 ?3383次閱讀
    万山特区| 百家乐官网平台租用| 百家乐游戏卡通| 24山72向局图解| 保单百家乐官网游戏机厂家| 清涧县| 六合彩全年资料| 大发888国际娱乐bet| 百家乐赌场彩| 迪威百家乐官网赌场娱乐网规则| Bet百家乐官网娱乐城| 百家乐官网筹码免运费| 澳门百家乐官网经历| 霍邱县| 洛扎县| 在线赌博| 绥宁县| 汤原县| 大发888娱乐场网址| 百家乐官网官网| 巴比伦百家乐官网的玩法技巧和规则| A8百家乐官网赌场娱乐网规则| 真人百家乐官网蓝盾娱乐场| 百家乐官网园云鼎赌场娱乐网规则 | 沙龙百家乐官网赌场娱乐网规则 | 葡京百家乐玩法| 澳门百家乐代理| 澳门百家乐海星王娱乐城| 百家乐平注法攻略| 财神百家乐的玩法技巧和规则| 长武县| 鸿胜国际| 闽清县| 立即博百家乐官网现金网| 百家乐官网下载免费软件| 百家乐官网在线洗码| 大西洋百家乐官网的玩法技巧和规则 | bet365投注网| 百家乐官网赢钱公式冯耕| 加州百家乐官网的玩法技巧和规则 | 大发888娱乐城真假|