<li id="ei08c"></li>
  • <li id="ei08c"><dl id="ei08c"></dl></li>
  • <button id="ei08c"><input id="ei08c"></input></button>
    <bdo id="ei08c"></bdo>
  • 2024年09月29日 星期天

    車載智能語(yǔ)音 好多人都做錯(cuò)了

    發(fā)布時(shí)間:2015-05-26 11:22:49  來(lái)源:車音網(wǎng)  作者:佚名  責(zé)任編輯:王庭

      從點(diǎn)擊到觸屏,再到語(yǔ)音,技術(shù)的升級(jí)也見(jiàn)證了人機(jī)交互從一個(gè)時(shí)代走向另一個(gè)時(shí)代。隨著人們需求和認(rèn)知得到提升,越來(lái)越多的人認(rèn)定,語(yǔ)音是未來(lái)智能化的方向,一大批企業(yè)也殺入了這一領(lǐng)域。但在鏖戰(zhàn)之余,一個(gè)問(wèn)題也浮現(xiàn)出來(lái)——我們應(yīng)該做什么樣的語(yǔ)音產(chǎn)品,該如何滿足消費(fèi)者的需求?在5月21日舉行的“蓋世微課堂——智能語(yǔ)音產(chǎn)品在汽車上的應(yīng)用與發(fā)展趨勢(shì)”活動(dòng)上,車音網(wǎng)聯(lián)席CEO王力劭與蘇雨農(nóng),就向300余名業(yè)內(nèi)人士分享了車音網(wǎng)對(duì)智能語(yǔ)音未來(lái)發(fā)展的看法。

      有取有舍 好用才是王道  提到車載智能語(yǔ)音產(chǎn)品,人們頭腦中的第一印象一定是“高科技”。不過(guò)就像大多數(shù)學(xué)者對(duì)“技術(shù)決定論”的批判一樣,智能語(yǔ)音的高大上,并不意味著它能獨(dú)立于人的意志而存在。

      “語(yǔ)音技術(shù)出身的科學(xué)家及車載產(chǎn)品經(jīng)理,可能會(huì)陷入技術(shù)化的思維”,車音網(wǎng)聯(lián)席CEO王力劭坦言。正如他所說(shuō),語(yǔ)音技術(shù)的應(yīng)用會(huì)面對(duì)類似感性思維和理性思維的困擾——到底是根據(jù)“我有什么然后做什么”的思維,還是用戶的需求來(lái)做產(chǎn)品。在這一點(diǎn)上,車音網(wǎng)的看法很明確,智能語(yǔ)音產(chǎn)品真正要解決的痛點(diǎn)并非技術(shù)本身,而是對(duì)需求的把握。用戶所要的,并非技術(shù)多么高級(jí),而是這個(gè)技術(shù)能否按照要求去完成任務(wù)。

      在目前的車載語(yǔ)音產(chǎn)品開發(fā)中,語(yǔ)音的“識(shí)別率”往往被放在了核心位置上。但在車音網(wǎng)看來(lái),服務(wù)的“達(dá)成率”才是真正的硬指標(biāo)。而車載智能語(yǔ)音產(chǎn)品要真正做到人性化,需要聚焦的一個(gè)重點(diǎn)問(wèn)題就是應(yīng)用場(chǎng)景。在適合的場(chǎng)景下,語(yǔ)音才能發(fā)揮它最大的效用。車音網(wǎng)聯(lián)席CEO蘇雨農(nóng)談道:“語(yǔ)音并非萬(wàn)能,作為便捷的工具,語(yǔ)音所能實(shí)現(xiàn)的功能應(yīng)該更聚焦、更有保障。在很多情況下,語(yǔ)音產(chǎn)品并非不能識(shí)別用戶的指令,而是沒(méi)有必要識(shí)別。”例如,在車載環(huán)境下,撥打電話這樣的功能就是合適的應(yīng)用場(chǎng)景,而用語(yǔ)音開關(guān)車窗,用戶體驗(yàn)就遠(yuǎn)遠(yuǎn)不及使用機(jī)械按鈕的方式。在訪談中,蘇雨農(nóng)和王力劭表示,產(chǎn)品的設(shè)計(jì)不能陷入技術(shù)化的思維,要真正考慮用戶對(duì)語(yǔ)音的核心需求,必要時(shí)甚至要用上“去語(yǔ)音化”的解決方案。

      車載智能語(yǔ)音產(chǎn)品 未來(lái)的技術(shù)重點(diǎn)是什么?

      無(wú)論是“去技術(shù)化”的思維,還是“去語(yǔ)音化”的解決方案,都是在產(chǎn)品素質(zhì)過(guò)硬的基礎(chǔ)上,對(duì)用戶需求滿足的更深層思考。無(wú)論如何,智能語(yǔ)音產(chǎn)品都離不開對(duì)技術(shù)的修煉。盡管車音網(wǎng)建立于2008年,但其技術(shù)團(tuán)隊(duì)早在近20年前,就開始了語(yǔ)音識(shí)別技術(shù)的研發(fā)。對(duì)于智能語(yǔ)音技術(shù)的發(fā)展方向,車音網(wǎng)有著自己的心得。

      首先,語(yǔ)音識(shí)別與硬件密不可分。要想實(shí)現(xiàn)完美的用戶體驗(yàn),簡(jiǎn)單地把語(yǔ)音識(shí)別引擎和硬件車機(jī)綁在一起是不夠的。麥克風(fēng)陣列排布以及車機(jī)設(shè)計(jì),都會(huì)影響語(yǔ)音識(shí)別的效果,而這也是未來(lái)語(yǔ)音識(shí)別重點(diǎn)探索的方向。為了讓語(yǔ)音識(shí)別更加精確,降噪技術(shù)、后臺(tái)引擎垂直度以及訓(xùn)練與車載環(huán)境的結(jié)合度,也都是需要注意的。

      其次是語(yǔ)音識(shí)別的容錯(cuò)性。具體說(shuō)來(lái),它分為對(duì)聲音的容錯(cuò)與對(duì)信息的容錯(cuò)?,F(xiàn)實(shí)生活中,對(duì)于突如其來(lái)的噪音以及無(wú)意識(shí)的口誤,語(yǔ)音技術(shù)能否結(jié)合搜索技術(shù)并做到容錯(cuò)是非常關(guān)鍵的。此外,語(yǔ)音技術(shù)還要能夠聽懂各地方言或各種表達(dá)方式。對(duì)于用戶而言,往往會(huì)追求多樣性,包括使用過(guò)程中偶然狀況的多樣性以及場(chǎng)景的多樣性等,針對(duì)上述多樣性,容錯(cuò)技術(shù)也顯得尤為重要。

      另外,語(yǔ)音技術(shù)完成識(shí)別之后,還需要進(jìn)行自然語(yǔ)言處理(NLP)和搜索,通過(guò)對(duì)自然語(yǔ)言的處理和理解,加上搜索技術(shù)和正確的返回信息,一個(gè)巨大的數(shù)據(jù)庫(kù)或知識(shí)庫(kù)得以形成,這種數(shù)據(jù)庫(kù)或知識(shí)庫(kù)可以針對(duì)語(yǔ)音識(shí)別的結(jié)果提供反饋信息。在用戶看來(lái),既然說(shuō)的話被識(shí)別,其返回來(lái)的結(jié)果就應(yīng)該正確,而不會(huì)去糾結(jié)識(shí)別出錯(cuò)抑或搜索出錯(cuò),因此自然語(yǔ)言處理和搜索這兩項(xiàng)技術(shù)的成熟度,也直接影響了語(yǔ)音識(shí)別技術(shù)的反饋結(jié)果。

      第四,云系統(tǒng)將會(huì)成為未來(lái)的主流趨勢(shì)。隨著移動(dòng)網(wǎng)絡(luò)帶寬不斷提升,資費(fèi)逐漸降低,云系統(tǒng)的優(yōu)勢(shì)將逐漸體現(xiàn)。依托大服務(wù)器群、大模型、大并發(fā),云系統(tǒng)能提供更好的語(yǔ)音識(shí)別能力和語(yǔ)義分析能力。而嵌入式芯片因?yàn)樵O(shè)備局限性,提升能力有限。不過(guò),王力劭也提到,目前云端與本地混用的模式是可行的,例如打電話的場(chǎng)景,本地化的解決方案就能很好的滿足需求。

      最后,從設(shè)計(jì)體驗(yàn)角度來(lái)看,目前對(duì)于技術(shù)出身的設(shè)計(jì)者往往是從自身設(shè)計(jì)角度出發(fā),只關(guān)心語(yǔ)音能做什么,從而導(dǎo)致語(yǔ)音設(shè)計(jì)存在一定的問(wèn)題。任何語(yǔ)音識(shí)別的模型都存在一定的局限性,而且語(yǔ)音技術(shù)本身是一項(xiàng)概率技術(shù),即使該技術(shù)能夠做到精準(zhǔn),外部的不可抗因素也可能會(huì)導(dǎo)致語(yǔ)音識(shí)別失效。設(shè)計(jì)者應(yīng)該更多地以用戶的應(yīng)用場(chǎng)景以及應(yīng)用需求為出發(fā)點(diǎn),去開發(fā)及設(shè)計(jì)語(yǔ)音產(chǎn)品。

      智能語(yǔ)音應(yīng)如何盈利?

      盈利模式是維系一個(gè)產(chǎn)業(yè)發(fā)展的命脈。無(wú)論智能語(yǔ)音如何夢(mèng)幻,沒(méi)有盈利模式,它也只能是空中樓閣,如水中月鏡中花,最終化為烏有。

      縱觀所有行業(yè),目前盈利模式主要分為傳統(tǒng)模式以及互聯(lián)網(wǎng)模式兩種。兩種模式的根源主要是圍繞從技術(shù)出發(fā)還是從盈利角度或未來(lái)價(jià)值實(shí)現(xiàn)角度出發(fā)點(diǎn),具體的模式主要分為產(chǎn)品售賣、服務(wù)租賃、影響力尋租,以及“東邊不亮西邊亮”式,即從其它領(lǐng)域獲得更高的收益值。

      在語(yǔ)音識(shí)別的應(yīng)用中,如果不能將其影響力傳遞給使用者,那么語(yǔ)音技術(shù)和語(yǔ)音平臺(tái)如何去謀求長(zhǎng)遠(yuǎn)的利益轉(zhuǎn)化,值得我們思考。解決方法分為兩種:

      ·將語(yǔ)音作為一種手段,重點(diǎn)垂直扎根于行業(yè)中。

      ·從語(yǔ)音技術(shù)本身去謀求贏利,將免費(fèi)開放平臺(tái)轉(zhuǎn)化成最終利益。

      車載智能語(yǔ)音的哲學(xué)

      可以說(shuō),近年來(lái)車載智能語(yǔ)音的研發(fā)與應(yīng)用已經(jīng)變成了一股浪潮。企業(yè)的蜂擁而上,讓這一行業(yè)顯得格外繁榮。但在蘇雨農(nóng)和王力劭看來(lái),我們應(yīng)該十分清醒地看待智能語(yǔ)音的發(fā)展,切實(shí)將用戶需求放在首位,摒棄為技術(shù)論的思維,才能為消費(fèi)者奉獻(xiàn)出他們想要的產(chǎn)品。

      “總之,我們要善用語(yǔ)音,慎用語(yǔ)音,垂直聚焦,體驗(yàn)為上”,王力劭總結(jié)道?;蛟S,這就是車載智能語(yǔ)音產(chǎn)品的真諦。

    • 股票名稱 最新價(jià) 漲跌幅