本期導(dǎo)讀
-Hi Siri,今天天氣怎么樣?
-今天天氣晴,18℃至27℃,空氣質(zhì)量指數(shù)36,優(yōu)。
手機(jī)、手表、音箱等智能設(shè)備極大地便利了我們的生活,隨著語(yǔ)音交互設(shè)備的發(fā)展,智能交互依然面臨很多挑戰(zhàn)。
我們每天要說(shuō)成百上千句話,長(zhǎng)短不一。即便是一些轉(zhuǎn)瞬即逝的口頭語(yǔ),也可以成為傳達(dá)自我意識(shí)的載體,向他人準(zhǔn)確傳達(dá)信息。可語(yǔ)言似乎是人類群體特有的專利,在過(guò)往的時(shí)間中,想借助語(yǔ)言與其他物種、物體建立清晰明確溝通關(guān)系的可能性無(wú)限趨近于零,直到智能語(yǔ)音技術(shù)的出現(xiàn)。
作為最早落地的人工智能技術(shù)之一,AI語(yǔ)音技術(shù)已經(jīng)得到了長(zhǎng)足的發(fā)展。如今,智能語(yǔ)音技術(shù)已經(jīng)被廣泛集成的就是家居產(chǎn)品之中。在即將到來(lái)的萬(wàn)物互聯(lián)時(shí)代,以語(yǔ)音交互為主的智能設(shè)備無(wú)疑將極具競(jìng)爭(zhēng)力與吸引力。仔細(xì)一想,一眾充滿科技感與未來(lái)感的智能設(shè)備,將天然具備人類最熟悉的“原始交互方式”,也頗有些化繁為簡(jiǎn)、返璞歸真的意味。
語(yǔ)音交互設(shè)備的“助聽(tīng)器”——ASR
在復(fù)雜環(huán)境中,我們總是可以忽略或弱化無(wú)關(guān)噪聲,集中注意力進(jìn)行溝通,但語(yǔ)音交互設(shè)備在如此環(huán)境中只會(huì)無(wú)所適從,不免陷入“交互尚未開(kāi)始,便已結(jié)束”的囧境。故此,設(shè)備擁有對(duì)各類“聲學(xué)場(chǎng)景”的聲源信號(hào)進(jìn)行處理、優(yōu)化功能的必要性不言而喻。而借助降噪NS、語(yǔ)音增強(qiáng)SE等技術(shù),可以對(duì)聲學(xué)場(chǎng)景中的非語(yǔ)音噪音信號(hào)進(jìn)行抑制,從含有噪音的語(yǔ)音信號(hào)中提取純凈語(yǔ)音,提升語(yǔ)音識(shí)別效果,讓語(yǔ)音交互設(shè)備可以分辨、傾聽(tīng)出目標(biāo)聲音,進(jìn)而為后續(xù)的語(yǔ)音交互掃清障礙。
在語(yǔ)音識(shí)別技術(shù)(ASR)的加持下,語(yǔ)音交互設(shè)備能對(duì)聲音信號(hào)進(jìn)行特征提取,提取而出的“特征”會(huì)作為參數(shù),為模型計(jì)算做準(zhǔn)備。簡(jiǎn)單理解就是將語(yǔ)音信息數(shù)字化,再通過(guò)相應(yīng)的模型對(duì)數(shù)字化信息進(jìn)行計(jì)算。后續(xù)通過(guò)聲學(xué)模型計(jì)算得出相應(yīng)的音素(即把聲音轉(zhuǎn)成音素),其目的是根據(jù)音素來(lái)找到對(duì)應(yīng)的漢字或者單詞,最終轉(zhuǎn)換成設(shè)備可以理解的文本。
語(yǔ)音交互設(shè)備的“聲卡”——TTS
基于語(yǔ)音合成技術(shù)(TTS),語(yǔ)音交互設(shè)備可對(duì)文本逐句分析,進(jìn)行詞匯、語(yǔ)法的和語(yǔ)義的分析,以確定句子的低層結(jié)構(gòu)和每個(gè)字的所對(duì)應(yīng)的音素組成,包括文本的斷句、字詞切分、多音字處理以及數(shù)字處理等。
在內(nèi)置芯片和神經(jīng)網(wǎng)絡(luò)技術(shù)的支持下,語(yǔ)音交互設(shè)備可把處理好的文本所對(duì)應(yīng)的單字或短語(yǔ)從語(yǔ)音合成庫(kù)中提取,使語(yǔ)言學(xué)描述轉(zhuǎn)化成言語(yǔ)波形,即把文字智能地轉(zhuǎn)化為自然語(yǔ)音流。至此,一次完整的語(yǔ)音交互便成功完成。當(dāng)然,在特有的智能語(yǔ)音控制器作用下,文本輸出的語(yǔ)音音律將會(huì)更加流暢,使得聽(tīng)者在聽(tīng)取信息時(shí)感覺(jué)自然、毫無(wú)機(jī)器語(yǔ)音輸出的冷漠與生澀感。
寫(xiě)在最后
誠(chéng)然,已普遍應(yīng)用于智能家居設(shè)備中的語(yǔ)音交互技術(shù)仍面臨諸多挑戰(zhàn),在設(shè)備喚醒率、識(shí)別率、誤報(bào)率、環(huán)境降噪等方面仍有改進(jìn)的空間。但毫無(wú)疑問(wèn),在未來(lái)語(yǔ)音作為人類最自然、最便捷的溝通方式,將會(huì)成為所有設(shè)備和產(chǎn)品至關(guān)重要的入口和人與機(jī)器之間的通信紐帶,而強(qiáng)邏輯、無(wú)視覺(jué)或者弱視覺(jué)的智能語(yǔ)音技術(shù)也會(huì)找到更多用武之地。
原文標(biāo)題:智能交互的盡頭是聊天?
文章出處:【微信公眾號(hào):安富利】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
審核編輯:湯梓紅
-
ASR
+關(guān)注
關(guān)注
2文章
43瀏覽量
18804 -
TTS
+關(guān)注
關(guān)注
0文章
42瀏覽量
10834 -
語(yǔ)音交互
+關(guān)注
關(guān)注
3文章
287瀏覽量
28072
原文標(biāo)題:智能交互的盡頭是聊天?
文章出處:【微信號(hào):AvnetAsia,微信公眾號(hào):安富利】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
HarmonyOS NEXT 應(yīng)用開(kāi)發(fā)練習(xí):AI智能語(yǔ)音播報(bào)
【「嵌入式系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)」閱讀體驗(yàn)】+ 基于語(yǔ)音識(shí)別的智能杯墊
基于智能語(yǔ)音交互的智能呼叫中心工作機(jī)制
![基于智能<b class='flag-5'>語(yǔ)音</b><b class='flag-5'>交互</b>的智能呼叫中心工作機(jī)制](https://file1.elecfans.com/web2/M00/E6/CD/wKgaomZFbauAGHl1AAAzh3hGv1M833.png)
ASR與傳統(tǒng)語(yǔ)音識(shí)別的區(qū)別
ASR技術(shù)的未來(lái)發(fā)展趨勢(shì) ASR系統(tǒng)常見(jiàn)問(wèn)題及解決方案
ASR和機(jī)器學(xué)習(xí)的關(guān)系
ASR在智能家居中的應(yīng)用
ASR語(yǔ)音識(shí)別技術(shù)應(yīng)用
語(yǔ)音提示器-WT3000A離在線TTS方案-打破語(yǔ)種限制/AI對(duì)話多功能支持
![<b class='flag-5'>語(yǔ)音</b>提示器-WT3000A離在線<b class='flag-5'>TTS</b>方案-打破語(yǔ)種限制/AI對(duì)話多功能支持](https://file1.elecfans.com//web1/M00/F3/AA/wKgaoWcbBCOAUnowAABYPUMJVlo522.png)
語(yǔ)音提示器-WT3000A離在線TTS方案-打破語(yǔ)種限制/AI對(duì)話多功能支持
![<b class='flag-5'>語(yǔ)音</b>提示器-WT3000A離在線<b class='flag-5'>TTS</b>方案-打破語(yǔ)種限制/AI對(duì)話多功能支持](https://file1.elecfans.com/web2/M00/8B/83/wKgaomSagEWAVS_tAAPQiIMOKhw250.png)
WT2605C TTS在線語(yǔ)音合成芯片:賦能多行業(yè)領(lǐng)域,引領(lǐng)產(chǎn)品智能化
![WT2605C <b class='flag-5'>TTS</b>在線<b class='flag-5'>語(yǔ)音</b>合成芯片:賦能多行業(yè)領(lǐng)域,引領(lǐng)產(chǎn)品智能化](https://file1.elecfans.com//web2/M00/06/2D/wKgZombinkiAKyLlAAJYpHmldXM241.jpg)
整合離線語(yǔ)音識(shí)別ASR和TTS,內(nèi)存映射時(shí)發(fā)生內(nèi)存不足怎么解決?
智能語(yǔ)音交互技術(shù)如何助力設(shè)備實(shí)現(xiàn)人機(jī)自然對(duì)話
WT3000T8-TTS語(yǔ)音合成芯片及應(yīng)用場(chǎng)景介紹
玩轉(zhuǎn)語(yǔ)音合成芯片(TTS芯片),看這一篇就夠了
![玩轉(zhuǎn)<b class='flag-5'>語(yǔ)音</b>合成芯片(<b class='flag-5'>TTS</b>芯片),看這一篇就夠了](https://file1.elecfans.com/web2/M00/C4/FB/wKgZomX5OteAMkkyAACVX1ew54M478.png)
評(píng)論