在當(dāng)下的汽車(chē)業(yè),語(yǔ)音基于其交互的自然性,被認(rèn)為是未來(lái)人與車(chē)交互的主要入口路徑,以致業(yè)內(nèi)普遍認(rèn)為,“以語(yǔ)音為入口連接各種服務(wù),構(gòu)建車(chē)聯(lián)網(wǎng)生態(tài)”。
作為人工智能應(yīng)用最成熟的技術(shù)之一,目前語(yǔ)音交互的核心環(huán)節(jié)也取得重大突破,語(yǔ)音識(shí)別環(huán)節(jié)突破了單點(diǎn)能力,從遠(yuǎn)場(chǎng)識(shí)別,到語(yǔ)音分析和語(yǔ)義理解有了重大突破,呈現(xiàn)一種整體的交互方案。
不過(guò),雖然大多數(shù)新車(chē)可以用語(yǔ)音開(kāi)啟車(chē)載導(dǎo)航,設(shè)置行車(chē)路線(xiàn),進(jìn)行信息查詢(xún),實(shí)現(xiàn)一些諸如空調(diào)、天窗等功能控制,但距離“以語(yǔ)音為入口連接各種服務(wù),構(gòu)建車(chē)聯(lián)網(wǎng)生態(tài)”的理想仍然較遠(yuǎn)。
比如,在真實(shí)使用場(chǎng)景中,距離麥克風(fēng)的遠(yuǎn)近、交談時(shí)是否說(shuō)方言,以及噪音、斷句等,都會(huì)讓語(yǔ)音識(shí)別的準(zhǔn)確率大打折扣。
目前,業(yè)內(nèi)普遍宣稱(chēng)的97%識(shí)別準(zhǔn)確率,更多的是人工測(cè)評(píng)結(jié)果,只在安靜室內(nèi)的近場(chǎng)識(shí)別中才能實(shí)現(xiàn)。
更難的是,在交互的過(guò)程中,機(jī)器對(duì)于語(yǔ)音的理解,以及人機(jī)多人的交互對(duì)話(huà),都存在問(wèn)題。
人在說(shuō)話(huà)時(shí),往往會(huì)一詞多義,人會(huì)基于已有知識(shí)儲(chǔ)備和上下文環(huán)境進(jìn)行理解,但現(xiàn)在的智能語(yǔ)音技術(shù)很難做到。
它對(duì)于說(shuō)話(huà)者的口誤,容錯(cuò)做得也不理想。用戶(hù)往往會(huì)追求多樣性,包括使用過(guò)程中偶然狀況的多樣性以及場(chǎng)景的多樣性等,因此容錯(cuò)技術(shù)顯得尤為重要。
顯然,目前智能語(yǔ)音的發(fā)展遠(yuǎn)未成熟,有著巨大的提升空間。再加上智能語(yǔ)音技術(shù)的巨大市場(chǎng)空間,互聯(lián)網(wǎng)巨頭已經(jīng)爭(zhēng)相進(jìn)入這一市場(chǎng)。
在中國(guó),記者注意到,百度、阿里巴巴、騰訊等諸多互聯(lián)網(wǎng)巨頭已經(jīng)入局,并先后推出自己的產(chǎn)品,以搶得智能語(yǔ)音信息流入口先機(jī)。
隨著互聯(lián)網(wǎng)巨頭進(jìn)軍智能語(yǔ)音領(lǐng)域,轉(zhuǎn)為全棧的語(yǔ)音技術(shù)創(chuàng)業(yè)公司,類(lèi)似科大訊飛這樣的傳統(tǒng)智能語(yǔ)音技術(shù)巨頭的不可替代性也受到了不可忽視的打擊,更多這幾年新興的語(yǔ)音技術(shù)公司更是命運(yùn)叵測(cè)。
互聯(lián)網(wǎng)巨頭雖然入場(chǎng)較晚,但憑借著自有的雄厚資金和互聯(lián)網(wǎng)行業(yè)的大數(shù)據(jù)資源,他們發(fā)展自家的人工智能技術(shù),迅速搶占智能語(yǔ)音市場(chǎng)。
那么,在未來(lái)的車(chē)聯(lián)網(wǎng)智能語(yǔ)音領(lǐng)域,誰(shuí)將是主宰?
以百度為例,這家以搜索起家的互聯(lián)網(wǎng)巨頭,正在轉(zhuǎn)型為人工智能公司,并在通用技術(shù)、算法和平臺(tái)開(kāi)發(fā)等領(lǐng)域發(fā)展,對(duì)話(huà)式AI操作系統(tǒng)百度DuerOS是其語(yǔ)音技術(shù)的重要平臺(tái)。
從2010年年開(kāi)始百度就將智能語(yǔ)音作為戰(zhàn)略方向,如今,百度語(yǔ)音技術(shù)已經(jīng)形成從模型算法、開(kāi)發(fā)組件、場(chǎng)景覆蓋到行業(yè)應(yīng)用的全鏈條。
2018年4月,北京車(chē)展上,博泰聯(lián)合開(kāi)發(fā)搭載百度DuerOS的人工智能車(chē)機(jī)系統(tǒng)——東風(fēng)風(fēng)神WindLink3.0,在學(xué)習(xí)能力、計(jì)算能力和數(shù)據(jù)儲(chǔ)備上極具優(yōu)勢(shì),可極快聽(tīng)清并真正聽(tīng)懂人復(fù)雜語(yǔ)言,并秒級(jí)提供用戶(hù)所需答案。
比如,只要用正常甚至很快的語(yǔ)速說(shuō)“好熱”“幫我看看附近帶泳池和WIFI的酒店”,系統(tǒng)就可以自動(dòng)調(diào)節(jié)空調(diào)溫度、搜索出對(duì)應(yīng)的結(jié)果,直接完成房間的預(yù)定,然后再導(dǎo)航到該酒店。
作為人工智能時(shí)代開(kāi)放賦能的生態(tài)系統(tǒng),DuerOS通過(guò)自身三大核心技術(shù)“喚醒”你的車(chē):讓車(chē)聽(tīng)清你在說(shuō)什么;讓車(chē)聽(tīng)懂你想要什么;讓車(chē)滿(mǎn)足你所提出的需求。
互聯(lián)網(wǎng)巨頭之所以能夠在AI語(yǔ)音上發(fā)展如此迅速,跟其大多是市場(chǎng)驅(qū)動(dòng)的企業(yè)有關(guān),明顯的特點(diǎn)就是他們有自己更好的產(chǎn)業(yè)落地環(huán)境,關(guān)注客戶(hù),注重長(zhǎng)期,由客戶(hù)需要驅(qū)動(dòng)產(chǎn)品發(fā)展。
這正是傳統(tǒng)語(yǔ)音技術(shù)提供商所欠缺的。
比如百度擁有百度搜索,騰訊擁有微信、QQ及游戲等龐大的產(chǎn)業(yè)落地環(huán)境,而阿里擁有淘寶及其線(xiàn)下的零售店,所以在AI語(yǔ)音產(chǎn)業(yè)落地上,互聯(lián)網(wǎng)巨頭會(huì)更有優(yōu)勢(shì)。
而像科大訊飛這樣傳統(tǒng)語(yǔ)音技術(shù)提供商是由技術(shù)推動(dòng)業(yè)務(wù)發(fā)展的企業(yè),產(chǎn)品開(kāi)發(fā)期間并不知道最終用戶(hù)是否會(huì)使用,相對(duì)市場(chǎng)驅(qū)動(dòng)來(lái)說(shuō)具有較高風(fēng)險(xiǎn)。
它以B to B模式和B to G模式為主,對(duì)全產(chǎn)業(yè)提供語(yǔ)音技術(shù),主要聚集在教育、司法、醫(yī)療、智慧城市等行業(yè)領(lǐng)域布局。2017年這些業(yè)務(wù)占公司營(yíng)收的比例約為80%。
雖然車(chē)聯(lián)網(wǎng)也是科大訊飛發(fā)展方向之一,也取得了不小的成就,但未來(lái)要往前再走一步并不容易,需要它在語(yǔ)義識(shí)別方面的人工智能技術(shù)方面進(jìn)一步突破。
人工智能本身是高度的資本密集型、知識(shí)密集型產(chǎn)業(yè)和數(shù)據(jù)密集型企業(yè),投入金額巨大,沒(méi)有足夠的數(shù)據(jù)、人員和資金,根本無(wú)法在核心賽道上堅(jiān)持下來(lái)。
百度宣布語(yǔ)音技術(shù)全系列永久免費(fèi),包括近場(chǎng)語(yǔ)音識(shí)別、長(zhǎng)語(yǔ)音識(shí)別、遠(yuǎn)場(chǎng)語(yǔ)音識(shí)別、語(yǔ)音合成、語(yǔ)音喚醒等百度語(yǔ)音核心功能等,并且支持IOS、Android等多平臺(tái)接入。
這些百度人工智能開(kāi)放平臺(tái)的核心基礎(chǔ)技術(shù),都是需要長(zhǎng)年的純投入,不計(jì)回報(bào),只有擁有其他大規(guī)模的獲利途徑,才能支撐這樣的研發(fā)投入和人才梯隊(duì)。
百度選擇了將平臺(tái)級(jí)技術(shù)開(kāi)放出來(lái)之后,令整個(gè)行業(yè)都在加速,同時(shí)也終結(jié)了國(guó)內(nèi)基礎(chǔ)技術(shù)的重復(fù)投入。
類(lèi)似于開(kāi)源軟件,開(kāi)放是一種戰(zhàn)略選擇,是領(lǐng)先者對(duì)于后來(lái)者的規(guī)范制定。行業(yè)后來(lái)者,必須與百度接軌,融入百度生態(tài)。
隨著互聯(lián)網(wǎng)巨頭在智能語(yǔ)音上面大范圍布局,如今在智能語(yǔ)音技術(shù)上它們都是使用自家的語(yǔ)音產(chǎn)品——阿里用自己的阿里YunOS語(yǔ)音識(shí)別技術(shù),騰訊的騰訊云也有自己的東西。
大客戶(hù)轉(zhuǎn)身成為競(jìng)爭(zhēng)對(duì)手,而且他們有自身的現(xiàn)金流業(yè)務(wù)、場(chǎng)景、數(shù)據(jù)和用戶(hù),他們會(huì)更有競(jìng)爭(zhēng)優(yōu)勢(shì),最終可能會(huì)在車(chē)聯(lián)網(wǎng)語(yǔ)音領(lǐng)域形成寡頭格局。如此,傳統(tǒng)智能語(yǔ)音技術(shù)企業(yè)可能被收編,也可能被消滅。
正是因?yàn)閾?dān)心這樣的結(jié)局發(fā)生,記者注意到,2017年11月,科大訊飛比較在意地宣傳騰訊的小Q機(jī)器人采用的是自己的語(yǔ)音識(shí)別技術(shù)。
或許在這方面,騰訊目前還并不強(qiáng)大,但趨勢(shì)已經(jīng)十分明顯。5月23日,騰訊董事會(huì)主席兼CEO馬化騰公開(kāi)表示,為了抓住萬(wàn)物互聯(lián)時(shí)代的機(jī)遇,騰訊近年來(lái)在語(yǔ)音識(shí)別、語(yǔ)義理解、計(jì)算機(jī)視覺(jué)等AI技術(shù)上投入大量的精力。
-
語(yǔ)音識(shí)別
+關(guān)注
關(guān)注
38文章
1697瀏覽量
112260 -
智能語(yǔ)音
+關(guān)注
關(guān)注
10文章
771瀏覽量
48603 -
科大訊飛
+關(guān)注
關(guān)注
19文章
772瀏覽量
60888
原文標(biāo)題:語(yǔ)音識(shí)別蛋糕還在,科大訊飛懸了?
文章出處:【微信號(hào):robot-1hjqr,微信公眾號(hào):1號(hào)機(jī)器人網(wǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論