現(xiàn)在語(yǔ)音交互在車(chē)載場(chǎng)景下有哪些應(yīng)用?痛點(diǎn)在哪些地方?難點(diǎn)在哪些地方?現(xiàn)在面臨哪些挑戰(zhàn)?怎么解決?包括產(chǎn)品設(shè)計(jì),諸多的一些想法、問(wèn)題,我來(lái)簡(jiǎn)單分享一下幾個(gè)觀點(diǎn),跟各位做一個(gè)交流。
我們見(jiàn)了很多的車(chē)載的后市場(chǎng),包括傳統(tǒng)產(chǎn)業(yè)轉(zhuǎn)型,包括互聯(lián)網(wǎng)新型智能硬件開(kāi)發(fā)者,像后視鏡、HUD等,現(xiàn)在大家普遍的感覺(jué)車(chē)載的語(yǔ)音交互是一個(gè)大的趨勢(shì),但是依然有一些認(rèn)為在車(chē)載場(chǎng)景下語(yǔ)音的交互還是一個(gè)噱頭。主要是因?yàn)槭褂寐首顝V但漸漸成為調(diào)戲工具的SIRI,其次他們擔(dān)心在車(chē)載場(chǎng)景下的使用語(yǔ)音的安全性。我們認(rèn)為, SIRI等助手在手機(jī)端變成調(diào)戲工具,這是一個(gè)必然。早期很多助手應(yīng)用我們語(yǔ)音技術(shù),接入思必馳語(yǔ)音云,通過(guò)數(shù)據(jù)分析發(fā)現(xiàn),很多用戶(hù)問(wèn)的事情是偏帶顏色的,比如問(wèn)一些AV女優(yōu)、AV大片名字方便查詢(xún)。其次,現(xiàn)在應(yīng)用語(yǔ)音的車(chē)載產(chǎn)品大多只能做到簡(jiǎn)單交互,只是為了市場(chǎng)跟風(fēng)而加上的功能,在產(chǎn)品設(shè)計(jì)和內(nèi)容方便明顯存在短板,不夠便捷不夠方便。
開(kāi)車(chē)是非常乏味的事情,因此車(chē)載交互也在向趣味性方向發(fā)展,比如高德做的林志玲航的導(dǎo)航,我問(wèn)了一下出租車(chē)司機(jī),其中一個(gè)司機(jī)特別典型,他說(shuō)我們開(kāi)車(chē)非常悶,林志玲的聲音讓我心里挺激動(dòng)的,沒(méi)有寂寞感。我們現(xiàn)在跟考拉也在做一些個(gè)性化的聲音,我們相信有人性化的車(chē)載交互會(huì)讓語(yǔ)音體驗(yàn)大幅增加,會(huì)讓用戶(hù)的黏性大幅提高。林志玲的聲音高德在做了,我相信女孩喜歡聽(tīng)男神的聲音,我們未來(lái)會(huì)出很多男神聲音、女神聲音,小孩聲音,個(gè)性化的語(yǔ)音合成,這本來(lái)也是思必馳的優(yōu)勢(shì)之一。
車(chē)載環(huán)境的語(yǔ)音交互,更重要的是能提升駕車(chē)安全。一般認(rèn)為,在車(chē)載里面的應(yīng)用操控應(yīng)該在兩秒之內(nèi),其實(shí)我覺(jué)得兩秒有點(diǎn)長(zhǎng),甚至應(yīng)該在一秒、零點(diǎn)幾秒,比如在高速上開(kāi)車(chē),速度是非常快的,如果分神去做操控非常危險(xiǎn)。但在設(shè)置導(dǎo)航、接聽(tīng)電話(huà)、發(fā)微信的時(shí)候,緊急情況還是需要去操控它。毫無(wú)疑問(wèn),語(yǔ)音操控更加安全的。現(xiàn)在車(chē)載產(chǎn)品的市場(chǎng)有1.6億,年增量2000萬(wàn),但是統(tǒng)計(jì)30%的車(chē)主在開(kāi)車(chē)的時(shí)候是離不開(kāi)手機(jī)的。這很危險(xiǎn)。媒體經(jīng)常曝光拿手機(jī)發(fā)微信、發(fā)微博等等導(dǎo)致車(chē)禍。電影《2012》大家都看過(guò),比尼說(shuō)出“enginestar”啟動(dòng)了保時(shí)捷死里逃生。在科幻電影里面的交互我相信在生活中能全部實(shí)現(xiàn)。現(xiàn)在市面上馬上會(huì)出現(xiàn)全自然語(yǔ)音交互的車(chē)載產(chǎn)品,比如像戰(zhàn)斗機(jī)應(yīng)用的HUD技術(shù),樂(lè)駕CEO老馬會(huì)跟大家分享他們的HUD產(chǎn)品。
車(chē)主到底對(duì)智能語(yǔ)音交互接受程度怎么樣?沒(méi)有用戶(hù)接受,一款產(chǎn)品還是rubbish。騰訊做的一個(gè)調(diào)研, 76%的用戶(hù)對(duì)車(chē)載智能功能接受度越來(lái)越高,全語(yǔ)音控制導(dǎo)航的功能使用占比排第二,僅次于被盜車(chē)輛定位,中國(guó)太不安全了,小偷太多沒(méi)辦法。但即使車(chē)輛的定位、被盜的問(wèn)題我相信未來(lái)語(yǔ)音的交互也能解決。比如現(xiàn)在我們汽車(chē)還是用鑰匙、用觸摸去開(kāi)門(mén),未來(lái)我們能不能用聲紋,比如說(shuō)芝麻開(kāi)門(mén),車(chē)能夠識(shí)別主人身份,你可以給愛(ài)車(chē)起名字,你說(shuō)話(huà)汽車(chē)就響應(yīng),別人說(shuō)話(huà)不好使,這個(gè)一定能實(shí)現(xiàn)。
另外在汽車(chē)前裝市場(chǎng)很多高端車(chē)把語(yǔ)音交互系統(tǒng)作為標(biāo)配,這能引領(lǐng)和培育用戶(hù)認(rèn)知。我個(gè)人認(rèn)為前裝市場(chǎng)還是相對(duì)很難進(jìn)入,而且創(chuàng)新的產(chǎn)品,優(yōu)秀的體驗(yàn)還是從后裝做起,包括HUD、行車(chē)記錄儀、后視鏡,中控設(shè)備。前裝市場(chǎng)的思路相對(duì)比較傳統(tǒng),需要被顛覆,而且驗(yàn)證周期特別長(zhǎng),像語(yǔ)音驗(yàn)證周期一般兩三年,甚至三五年,飛馳鎂物很有經(jīng)驗(yàn),他們做了多年傳統(tǒng)前裝。
我們現(xiàn)在提智能語(yǔ)音基本上都認(rèn)為語(yǔ)音導(dǎo)航,其實(shí)不單單是導(dǎo)航,車(chē)載語(yǔ)音交互在向其他應(yīng)用擴(kuò)展,服務(wù)性擴(kuò)展。回頭看,從2011年智能車(chē)載化到現(xiàn)在經(jīng)過(guò)了大概三個(gè)階段,傻瓜式1.0,擴(kuò)展式2.0,和交互式的3.0。在2.0的時(shí)候語(yǔ)音控制還是比較低級(jí),在交互式3.0語(yǔ)音需求和功能已經(jīng)上升第一位,甚至超過(guò)了LBS。再一個(gè)是相關(guān)的應(yīng)用的服務(wù),內(nèi)嵌的語(yǔ)音交互在大量拓展,整個(gè)車(chē)載生態(tài)在更繼續(xù)發(fā)展。
除了導(dǎo)航,其他很多服務(wù)和功能都需要語(yǔ)音交互,而且會(huì)做的越來(lái)越炫、越來(lái)越酷。比如收發(fā)短信,有些車(chē)載智能硬件已經(jīng)有這個(gè)功能,撥打電話(huà),包括小說(shuō)朗讀,天氣搜索,網(wǎng)絡(luò)電臺(tái)等等都已經(jīng)逐步邁入市場(chǎng)。網(wǎng)絡(luò)電臺(tái)方面,考拉做的很棒,未來(lái)我們跟老俞這方面會(huì)做的更加炫酷,有的人愿意聽(tīng)謝霆峰的聲音,那你就可以選謝霆峰的聲音給你讀小說(shuō),現(xiàn)在這個(gè)技術(shù)已經(jīng)基本成熟,未來(lái)你把家人的聲音,比如男朋友、女朋友或者孩子聲音傳上去,自己下載一個(gè)語(yǔ)音包,未來(lái)你聽(tīng)小說(shuō)、聽(tīng)電臺(tái)的內(nèi)容、聽(tīng)新聞等等,這些都可以是你愛(ài)人的聲音、孩子的聲音,我們目前跟考拉、跟上海交大實(shí)驗(yàn)室都在做這些事情。再一個(gè)微信,微信功能也是一個(gè)痛點(diǎn)需求,很多車(chē)禍就是因?yàn)樗緳C(jī)在開(kāi)車(chē)的時(shí)候收發(fā)微信,這一塊怎么做到極致體驗(yàn)?一定要語(yǔ)音解決,樂(lè)駕做HUD“車(chē)蘿卜”,已經(jīng)解決了這個(gè)難點(diǎn)。另外,關(guān)于未來(lái)的拓展我很看好O2O,車(chē)載生態(tài)不僅僅是解決目前的一些功能,未來(lái)能不能我們?cè)谒鸭佑驼尽⑼\?chē)位、酒店時(shí),像在手機(jī)端一樣形成一個(gè)閉環(huán),從搜索到導(dǎo)航到支付交易評(píng)價(jià)。社交,開(kāi)車(chē)的時(shí)候我們通過(guò)行車(chē)記錄儀也好、HUD也好直接給景色拍照,全語(yǔ)音操作,能夠直接分享到微博、微信上。包括聲紋密碼,聲紋密碼不單是解鎖開(kāi)車(chē),不單是個(gè)人支付,我們希望要做到的就是它知道你的身份,知道你的相關(guān)的信息,推送的信息都是個(gè)性化的,甚至我們通過(guò)登陸查酒店的時(shí)候它知道你是男女,你的歷史記錄,你的年齡段。這些都是語(yǔ)音交互在車(chē)載方面的應(yīng)用可能。
現(xiàn)在車(chē)載智能硬件層出不窮,車(chē)機(jī)相對(duì)來(lái)說(shuō)是挺主流的設(shè)備。現(xiàn)在后視鏡市場(chǎng)特別火,行車(chē)記錄儀防碰瓷現(xiàn)在也非常流行,OBD目前還比較傳統(tǒng),車(chē)載音箱比如考拉做得很不錯(cuò),再包括一些其他的小智能硬件,車(chē)載環(huán)境里面到底哪一塊屏?xí)贾髁鳎窟€有一個(gè)說(shuō)法,HUD抬頭顯示系統(tǒng)在戰(zhàn)斗機(jī)、高端車(chē)?yán)锩娑加校F(xiàn)在全自然語(yǔ)音交互加手勢(shì)式交互的HUD概念已經(jīng)出來(lái)了,比如樂(lè)駕的“車(chē)蘿卜”,我覺(jué)得HUD也有很大可能,撬動(dòng)未來(lái)車(chē)載的生態(tài)。不管怎么樣,絕對(duì)離不開(kāi)語(yǔ)音交互。
從傻瓜式1.0到語(yǔ)音交互式3.0,從語(yǔ)音導(dǎo)航到其他功能,現(xiàn)已經(jīng)一步步成為現(xiàn)實(shí)。但現(xiàn)在去暢想O2O、聲紋密碼等,語(yǔ)音技術(shù)是不是已經(jīng)能夠直接應(yīng)用?我覺(jué)得還不到時(shí)候。語(yǔ)音交互雖然實(shí)現(xiàn)了技術(shù)上的可能性,但離質(zhì)的飛躍還有距離。目前的語(yǔ)音只是在載里面加上一個(gè)耳朵、一個(gè)嘴巴,還缺一個(gè)大腦,如何去協(xié)調(diào)在車(chē)載環(huán)境下遇到的種種挑戰(zhàn)。
第一,近場(chǎng)抗噪。語(yǔ)音識(shí)別在駕車(chē)的噪聲環(huán)境下怎么樣,人跟車(chē)機(jī)或者車(chē)載智能硬件往往有一段距離,0.3~1米的距離范圍里,噪聲很多,發(fā)動(dòng)機(jī)聲噪、路噪、人的說(shuō)話(huà),音噪等,怎樣抗噪?播放音樂(lè)的時(shí)候回聲對(duì)消我們已經(jīng)能夠?qū)崿F(xiàn),在跟多種車(chē)載設(shè)備交互下的算法降噪,我們思必馳一直在研發(fā)并且目前也有一些還比較滿(mǎn)意的進(jìn)步。
第二,自然語(yǔ)音交互。這是讓車(chē)載生態(tài)能夠發(fā)展最核心音素,現(xiàn)在車(chē)載交互還大多停留在簡(jiǎn)單操控階段,簡(jiǎn)單控制、簡(jiǎn)單命令、簡(jiǎn)單搜索、簡(jiǎn)單查詢(xún)。但如果我們想撬動(dòng)O2O,一定要首先形成閉環(huán)。就像人跟手機(jī)的關(guān)系,所有的購(gòu)物、查詢(xún)搜索、玩游戲一定會(huì)在智能手機(jī)完成,不會(huì)再跳轉(zhuǎn)另一個(gè)設(shè)備上。車(chē)載生態(tài)起來(lái)一定會(huì)形成一個(gè)閉環(huán),不僅僅是簡(jiǎn)單語(yǔ)音交互,一定是自然語(yǔ)言的交互、一定是對(duì)話(huà)式交互,這個(gè)是應(yīng)用趨勢(shì)。思必馳目前一直在努力地,就是真正的對(duì)話(huà)式人性化語(yǔ)言交互技術(shù)。
第三,產(chǎn)品設(shè)計(jì)層面的邏輯關(guān)系。我們智能車(chē)載硬件的麥克風(fēng)、喇叭、結(jié)構(gòu)布局和錄音收音效果的關(guān)系,怎么保證抗噪,包括我們語(yǔ)音交互跟后端服務(wù)怎么結(jié)合。比如語(yǔ)音導(dǎo)航時(shí),能不能跳轉(zhuǎn)到搜音樂(lè),在導(dǎo)航的時(shí)候能不能收發(fā)微信等,產(chǎn)品邏輯這是非常大的挑戰(zhàn)。這需要產(chǎn)品開(kāi)發(fā)者和思必馳一起來(lái)討論來(lái)解決的問(wèn)題。
(高總此刻給大家放了兩個(gè)視頻,一個(gè)是春節(jié)期間的山東糾正哥的網(wǎng)絡(luò)視頻,一個(gè)是思必馳最新的可糾正打斷功能的實(shí)際演示視頻。涉及到技術(shù)曝光,此刻先不做播放。如有興趣的,可關(guān)注7月中旬的思必馳新技術(shù)發(fā)布會(huì)。)
這是我們做的一個(gè)語(yǔ)音糾正的功能演示。糾正哥遇到的問(wèn)題我們?cè)谲?chē)?yán)锩娴臅r(shí)候經(jīng)常遇到,在車(chē)載噪聲環(huán)境下語(yǔ)音識(shí)別很難達(dá)到百分之百,現(xiàn)在語(yǔ)音交互還是比較差,經(jīng)常會(huì)讓人抓狂,我們就做這批技術(shù),能夠隨時(shí)打斷和糾正機(jī)器的判斷和識(shí)別。我們?cè)?月份會(huì)有新技術(shù)的大型發(fā)布會(huì),到時(shí)候會(huì)邀請(qǐng)各位朋友參加。目前的語(yǔ)音交互僅僅實(shí)現(xiàn)操控、命令,簡(jiǎn)單的查詢(xún),這是遠(yuǎn)遠(yuǎn)不行的,一定是真正的智能語(yǔ)音的技術(shù)的進(jìn)步,才能讓整個(gè)生態(tài)進(jìn)來(lái),才能讓整個(gè)整個(gè)產(chǎn)品體驗(yàn)帶來(lái)質(zhì)的飛躍。
最后插播小廣告——關(guān)于思必馳。我們最早成立劍橋大學(xué),現(xiàn)在拿到兩輪投資,我們專(zhuān)注人機(jī)對(duì)話(huà),以及語(yǔ)音識(shí)別、理解、合成、設(shè)備一系列技術(shù),我們把這個(gè)技術(shù)做成開(kāi)放解決方案,提供垂直行業(yè)像車(chē)載、家居、穿戴,包括機(jī)器人玩具等等這些行業(yè)的開(kāi)發(fā)者,讓他們結(jié)成了我們的相關(guān)的SDK方案以后提升產(chǎn)品的交互體驗(yàn)。車(chē)載方面我們對(duì)芯片廠商、方案廠商,還有車(chē)載智能硬件合作伙伴提供我們們相關(guān)的技術(shù)和方案。
-
導(dǎo)航
+關(guān)注
關(guān)注
7文章
533瀏覽量
42552 -
智能語(yǔ)音
+關(guān)注
關(guān)注
10文章
789瀏覽量
48904 -
思必馳
+關(guān)注
關(guān)注
4文章
289瀏覽量
14322
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論