本站原創(chuàng),作者:章鷹,電子發(fā)燒友執(zhí)行副主編。
美國(guó)研究公司Strategy Analytics近日發(fā)布了《2018年第三季度全球智能音箱市場(chǎng)報(bào)告》。報(bào)告顯示,全球智能音箱出貨量第三季度達(dá)到2270萬(wàn),同比增長(zhǎng)197%,創(chuàng)歷史新高。亞馬遜在第三季度依然市場(chǎng)占有率最高,占據(jù)了32%的份額,谷歌以23%的份額緊追其后。百度的加入改變了全球智能音箱的市場(chǎng)格局,市場(chǎng)占有率猛增至8%,進(jìn)入全球前四名。
“據(jù)IDC統(tǒng)計(jì),2018年第三季度,搭載百度DuerOS的智能音箱在中國(guó)市場(chǎng)出貨量第一名,小度系列智能硬件在中國(guó)市場(chǎng)增速最快,市場(chǎng)份額增至24%。百度在遠(yuǎn)場(chǎng)語(yǔ)音技術(shù)上有很大的突破。我們和Duer OS生態(tài)一起發(fā)展,上周Duer OS產(chǎn)品的出貨量突破2億。這與百度遠(yuǎn)場(chǎng)語(yǔ)音技術(shù)的突破是密切相關(guān)的?!鞍俣日Z(yǔ)音部門負(fù)責(zé)人在1月16日深圳舉辦的百度大腦硬件及平臺(tái)發(fā)布會(huì)現(xiàn)場(chǎng)表示。
遠(yuǎn)場(chǎng)語(yǔ)音技術(shù)三大關(guān)鍵點(diǎn)
2017年年初,各家開發(fā)廠商針對(duì)遠(yuǎn)場(chǎng)語(yǔ)音技術(shù)進(jìn)行軍備競(jìng)賽,智能音箱的市場(chǎng)大戰(zhàn),從2017年開始到現(xiàn)在,是從近場(chǎng)語(yǔ)音技術(shù)到遠(yuǎn)場(chǎng)語(yǔ)音技術(shù)的過(guò)度階段,廠商會(huì)介紹自己的遠(yuǎn)場(chǎng)語(yǔ)音技術(shù)多么厲害,現(xiàn)在很少有人提手機(jī)上語(yǔ)音識(shí)別的效果。
遠(yuǎn)場(chǎng)語(yǔ)音技術(shù)的三大關(guān)鍵點(diǎn):第一、信號(hào)處理,沒有信號(hào)處理,就沒有現(xiàn)在的遠(yuǎn)場(chǎng)語(yǔ)音的效果,信號(hào)處理用于定位,定位算法才能創(chuàng)造遠(yuǎn)場(chǎng)語(yǔ)音智能;第二、軟硬結(jié)合,在遠(yuǎn)場(chǎng)交互時(shí)代,需要與硬度深度結(jié)合,將算法、軟件在硬件上打磨好,提升用戶體驗(yàn);第三、端到端語(yǔ)音語(yǔ)言一體化,信號(hào)處理基于端到端建模,聲學(xué)模型是匹配好場(chǎng)景的,還有喚醒技術(shù),采用端到端思路,對(duì)端到端詞匯進(jìn)行建模,再將喚醒技術(shù)和信號(hào)處理技術(shù)結(jié)合,下沉到Duer OS系統(tǒng)層,才能達(dá)到很好的喚醒效果。
語(yǔ)音技術(shù)軟硬一體化解決方案
教會(huì)機(jī)器聽懂人話的過(guò)程,就是通過(guò)深度神經(jīng)網(wǎng)絡(luò)訓(xùn)練聲學(xué)模型和語(yǔ)言模型的過(guò)程。而一些公司宣傳的機(jī)器識(shí)別準(zhǔn)確率過(guò)高,速記員都達(dá)不到這一水平,還有很多相關(guān)的工作需要去完成,不能單靠深度神經(jīng)網(wǎng)絡(luò)的方法來(lái)實(shí)現(xiàn)。語(yǔ)音識(shí)別準(zhǔn)確率涉及多方面原因,例如遠(yuǎn)場(chǎng)精確識(shí)別就是業(yè)界難題。
“最新一年百度在語(yǔ)音技術(shù)上兩大進(jìn)展:一次喚醒多次交互技術(shù),技術(shù)特點(diǎn)是信號(hào)尾點(diǎn)和語(yǔ)義尾點(diǎn)聯(lián)合優(yōu)化模型;第二點(diǎn),針對(duì)聲學(xué)模型和語(yǔ)義模型做雙重的置信度模型,在喚醒一次后可以和機(jī)器進(jìn)行自由交談,技術(shù)的關(guān)鍵點(diǎn)是將干擾信息去除。需要端到端的思路,用信號(hào)衰減的思路,配合聲紋技術(shù),進(jìn)行交互。這個(gè)技術(shù)會(huì)在小度系列的硬件產(chǎn)品落地?!?百度語(yǔ)音部門負(fù)責(zé)人解釋說(shuō)。
百度在遠(yuǎn)場(chǎng)語(yǔ)音交互技術(shù)突破,包括一次喚醒多次交互技術(shù)以及 SMLTA 模型,SMLTA 模型在百度輸入法正式發(fā)布這個(gè)技術(shù),特點(diǎn)是語(yǔ)言和語(yǔ)義進(jìn)行建模訓(xùn)練,這個(gè)模型可以跑在手機(jī)端,取得和在線識(shí)別媲美的效果。
百度歷經(jīng)一年多的打磨和開發(fā),全新推出了百度遠(yuǎn)場(chǎng)語(yǔ)音開發(fā)套件,包括遠(yuǎn)場(chǎng)語(yǔ)音端到端技術(shù)、兩款分別主打高性能和高性價(jià)比的計(jì)算板卡、3種形態(tài)的麥克風(fēng)陣列,形成了環(huán)形6+1麥、線形4麥和車載3麥的多形態(tài)麥克風(fēng)陣列套件方案。
“讓硬件制造商、ODM、OEM做智能音箱、智能電視、語(yǔ)音機(jī)器人、可穿戴設(shè)備和車載可以在百度大腦上找到和使用語(yǔ)音開發(fā)套件。我們希望提供一條產(chǎn)業(yè)鏈,讓上下游合作起來(lái)?!?百度語(yǔ)音部門負(fù)責(zé)人強(qiáng)調(diào)說(shuō)?!斑@套開發(fā)套件的優(yōu)勢(shì),靈活、快速讓開發(fā)者對(duì)接自己在場(chǎng)景中的資源,對(duì)接語(yǔ)義理解能力,對(duì)接知識(shí)庫(kù)。“
百度遠(yuǎn)場(chǎng)語(yǔ)音開發(fā)套件基于端到端方案,嚴(yán)格按照最佳技術(shù)實(shí)踐指導(dǎo)生產(chǎn),可解決語(yǔ)音交互產(chǎn)品研發(fā)過(guò)程中無(wú)可用設(shè)備選型、選型調(diào)試成本大、調(diào)試效果不佳等問(wèn)題。該方案支持回聲消除、聲源定位、波束形成、噪聲抑制等處理算法,一、三、五米識(shí)別和喚醒效果優(yōu)于同類產(chǎn)品,目前已落地150多款產(chǎn)品。
車載三麥克陣列,車上語(yǔ)音識(shí)別要求比較高,不僅是主音區(qū),而且是雙音區(qū)的語(yǔ)音識(shí)別,除了主駕駛位,還包括副駕駛位,百度車載三麥克鈍角陣列放置在車頂,可以輕松實(shí)現(xiàn)主音區(qū)和雙音區(qū)的語(yǔ)音識(shí)別,解決方案已經(jīng)在百度車聯(lián)網(wǎng)聯(lián)盟內(nèi)的被多個(gè)車廠采用。百度還在做DSP相關(guān)技術(shù),配合麥克風(fēng)陣列,價(jià)格更有競(jìng)爭(zhēng)力。
主流芯片價(jià)格透明,兩年原廠開發(fā)經(jīng)驗(yàn),主板方案非常有競(jìng)爭(zhēng)力。合作模式:語(yǔ)音端到端產(chǎn)品,開發(fā)時(shí)間長(zhǎng),需要重新開模和設(shè)計(jì),直接貼牌,提供產(chǎn)品原型,在這個(gè)基礎(chǔ)上做二次開發(fā);線下做開發(fā),把方案放入適用的產(chǎn)品內(nèi)部。
百度大腦AI硬件生態(tài)聯(lián)盟
發(fā)布會(huì)現(xiàn)場(chǎng),百度聯(lián)合首批合作伙伴成立百度大腦硬件生態(tài)聯(lián)盟,首批聯(lián)盟伙伴包含芯片廠商賽靈思,攝像頭模組廠商奧比中光、睿識(shí)、慧谷航天,開發(fā)套件廠商天啟,終端設(shè)備廠商華正聯(lián)等等。作為聯(lián)盟發(fā)起人和組織者,百度大腦希望與聯(lián)盟伙伴一起,共同制訂端計(jì)算與AI硬件標(biāo)準(zhǔn),共同促進(jìn)和繁榮AI落地應(yīng)用。
百度大腦也將對(duì)聯(lián)盟合作伙伴提供深度技術(shù)支持、渠道支持、品牌授權(quán)、產(chǎn)品折扣和運(yùn)營(yíng)資源等權(quán)益,全面開啟AI技術(shù)終端化的大門,賦能合作伙伴的同時(shí)為產(chǎn)業(yè)帶來(lái)加速的交流和融合。正如百度AI技術(shù)生態(tài)部總經(jīng)理喻友平所言,人工智能若要長(zhǎng)期推動(dòng)各個(gè)產(chǎn)業(yè)的升級(jí)與優(yōu)化,需要合作伙伴的共同努力,打造適合AI發(fā)展的健康環(huán)境。
-
百度
+關(guān)注
關(guān)注
9文章
2234瀏覽量
89839 -
語(yǔ)音識(shí)別
+關(guān)注
關(guān)注
38文章
1696瀏覽量
112248 -
智能音箱
+關(guān)注
關(guān)注
31文章
1781瀏覽量
78279
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論