0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

2018年Q3中國(guó)最火的智能音箱!秘密竟然是遠(yuǎn)場(chǎng)語(yǔ)音技術(shù)

章鷹觀察 ? 來(lái)源:電子發(fā)燒友原創(chuàng) ? 作者:章鷹 ? 2019-01-19 00:01 ? 次閱讀

本站原創(chuàng),作者:章鷹,電子發(fā)燒友執(zhí)行副主編。

美國(guó)研究公司Strategy Analytics近日發(fā)布了《2018年第三季度全球智能音箱市場(chǎng)報(bào)告》。報(bào)告顯示,全球智能音箱出貨量第三季度達(dá)到2270萬(wàn),同比增長(zhǎng)197%,創(chuàng)歷史新高。亞馬遜在第三季度依然市場(chǎng)占有率最高,占據(jù)了32%的份額,谷歌以23%的份額緊追其后。百度的加入改變了全球智能音箱的市場(chǎng)格局,市場(chǎng)占有率猛增至8%,進(jìn)入全球前四名。

“據(jù)IDC統(tǒng)計(jì),2018年第三季度,搭載百度DuerOS的智能音箱在中國(guó)市場(chǎng)出貨量第一名,小度系列智能硬件在中國(guó)市場(chǎng)增速最快,市場(chǎng)份額增至24%。百度在遠(yuǎn)場(chǎng)語(yǔ)音技術(shù)上有很大的突破。我們和Duer OS生態(tài)一起發(fā)展,上周Duer OS產(chǎn)品的出貨量突破2億。這與百度遠(yuǎn)場(chǎng)語(yǔ)音技術(shù)的突破是密切相關(guān)的?!鞍俣日Z(yǔ)音部門負(fù)責(zé)人在1月16日深圳舉辦的百度大腦硬件及平臺(tái)發(fā)布會(huì)現(xiàn)場(chǎng)表示。

遠(yuǎn)場(chǎng)語(yǔ)音技術(shù)三大關(guān)鍵點(diǎn)

2017年年初,各家開發(fā)廠商針對(duì)遠(yuǎn)場(chǎng)語(yǔ)音技術(shù)進(jìn)行軍備競(jìng)賽,智能音箱的市場(chǎng)大戰(zhàn),從2017年開始到現(xiàn)在,是從近場(chǎng)語(yǔ)音技術(shù)到遠(yuǎn)場(chǎng)語(yǔ)音技術(shù)的過(guò)度階段,廠商會(huì)介紹自己的遠(yuǎn)場(chǎng)語(yǔ)音技術(shù)多么厲害,現(xiàn)在很少有人提手機(jī)語(yǔ)音識(shí)別的效果。

遠(yuǎn)場(chǎng)語(yǔ)音技術(shù)的三大關(guān)鍵點(diǎn):第一、信號(hào)處理,沒有信號(hào)處理,就沒有現(xiàn)在的遠(yuǎn)場(chǎng)語(yǔ)音的效果,信號(hào)處理用于定位,定位算法才能創(chuàng)造遠(yuǎn)場(chǎng)語(yǔ)音智能;第二、軟硬結(jié)合,在遠(yuǎn)場(chǎng)交互時(shí)代,需要與硬度深度結(jié)合,將算法、軟件在硬件上打磨好,提升用戶體驗(yàn);第三、端到端語(yǔ)音語(yǔ)言一體化,信號(hào)處理基于端到端建模,聲學(xué)模型是匹配好場(chǎng)景的,還有喚醒技術(shù),采用端到端思路,對(duì)端到端詞匯進(jìn)行建模,再將喚醒技術(shù)和信號(hào)處理技術(shù)結(jié)合,下沉到Duer OS系統(tǒng)層,才能達(dá)到很好的喚醒效果。

語(yǔ)音技術(shù)軟硬一體化解決方案

教會(huì)機(jī)器聽懂人話的過(guò)程,就是通過(guò)深度神經(jīng)網(wǎng)絡(luò)訓(xùn)練聲學(xué)模型和語(yǔ)言模型的過(guò)程。而一些公司宣傳的機(jī)器識(shí)別準(zhǔn)確率過(guò)高,速記員都達(dá)不到這一水平,還有很多相關(guān)的工作需要去完成,不能單靠深度神經(jīng)網(wǎng)絡(luò)的方法來(lái)實(shí)現(xiàn)。語(yǔ)音識(shí)別準(zhǔn)確率涉及多方面原因,例如遠(yuǎn)場(chǎng)精確識(shí)別就是業(yè)界難題。

最新一年百度在語(yǔ)音技術(shù)上兩大進(jìn)展:一次喚醒多次交互技術(shù),技術(shù)特點(diǎn)是信號(hào)尾點(diǎn)和語(yǔ)義尾點(diǎn)聯(lián)合優(yōu)化模型;第二點(diǎn),針對(duì)聲學(xué)模型和語(yǔ)義模型做雙重的置信度模型,在喚醒一次后可以和機(jī)器進(jìn)行自由交談,技術(shù)的關(guān)鍵點(diǎn)是將干擾信息去除。需要端到端的思路,用信號(hào)衰減的思路,配合聲紋技術(shù),進(jìn)行交互。這個(gè)技術(shù)會(huì)在小度系列的硬件產(chǎn)品落地?!?百度語(yǔ)音部門負(fù)責(zé)人解釋說(shuō)。

百度在遠(yuǎn)場(chǎng)語(yǔ)音交互技術(shù)突破,包括一次喚醒多次交互技術(shù)以及 SMLTA 模型,SMLTA 模型在百度輸入法正式發(fā)布這個(gè)技術(shù),特點(diǎn)是語(yǔ)言和語(yǔ)義進(jìn)行建模訓(xùn)練,這個(gè)模型可以跑在手機(jī)端,取得和在線識(shí)別媲美的效果。

百度歷經(jīng)一年多的打磨和開發(fā),全新推出了百度遠(yuǎn)場(chǎng)語(yǔ)音開發(fā)套件,包括遠(yuǎn)場(chǎng)語(yǔ)音端到端技術(shù)、兩款分別主打高性能和高性價(jià)比的計(jì)算板卡、3種形態(tài)的麥克風(fēng)陣列,形成了環(huán)形6+1麥、線形4麥和車載3麥的多形態(tài)麥克風(fēng)陣列套件方案。

“讓硬件制造商、ODM、OEM做智能音箱、智能電視、語(yǔ)音機(jī)器人、可穿戴設(shè)備和車載可以在百度大腦上找到和使用語(yǔ)音開發(fā)套件。我們希望提供一條產(chǎn)業(yè)鏈,讓上下游合作起來(lái)?!?百度語(yǔ)音部門負(fù)責(zé)人強(qiáng)調(diào)說(shuō)?!斑@套開發(fā)套件的優(yōu)勢(shì),靈活、快速讓開發(fā)者對(duì)接自己在場(chǎng)景中的資源,對(duì)接語(yǔ)義理解能力,對(duì)接知識(shí)庫(kù)。“

百度遠(yuǎn)場(chǎng)語(yǔ)音開發(fā)套件基于端到端方案,嚴(yán)格按照最佳技術(shù)實(shí)踐指導(dǎo)生產(chǎn),可解決語(yǔ)音交互產(chǎn)品研發(fā)過(guò)程中無(wú)可用設(shè)備選型、選型調(diào)試成本大、調(diào)試效果不佳等問(wèn)題。該方案支持回聲消除、聲源定位、波束形成、噪聲抑制等處理算法,一、三、五米識(shí)別和喚醒效果優(yōu)于同類產(chǎn)品,目前已落地150多款產(chǎn)品。

車載三麥克陣列,車上語(yǔ)音識(shí)別要求比較高,不僅是主音區(qū),而且是雙音區(qū)的語(yǔ)音識(shí)別,除了主駕駛位,還包括副駕駛位,百度車載三麥克鈍角陣列放置在車頂,可以輕松實(shí)現(xiàn)主音區(qū)和雙音區(qū)的語(yǔ)音識(shí)別,解決方案已經(jīng)在百度車聯(lián)網(wǎng)聯(lián)盟內(nèi)的被多個(gè)車廠采用。百度還在做DSP相關(guān)技術(shù),配合麥克風(fēng)陣列,價(jià)格更有競(jìng)爭(zhēng)力。

主流芯片價(jià)格透明,兩年原廠開發(fā)經(jīng)驗(yàn),主板方案非常有競(jìng)爭(zhēng)力。合作模式:語(yǔ)音端到端產(chǎn)品,開發(fā)時(shí)間長(zhǎng),需要重新開模和設(shè)計(jì),直接貼牌,提供產(chǎn)品原型,在這個(gè)基礎(chǔ)上做二次開發(fā);線下做開發(fā),把方案放入適用的產(chǎn)品內(nèi)部。

百度大腦AI硬件生態(tài)聯(lián)盟

發(fā)布會(huì)現(xiàn)場(chǎng),百度聯(lián)合首批合作伙伴成立百度大腦硬件生態(tài)聯(lián)盟,首批聯(lián)盟伙伴包含芯片廠商賽靈思,攝像頭模組廠商奧比中光、睿識(shí)、慧谷航天,開發(fā)套件廠商天啟,終端設(shè)備廠商華正聯(lián)等等。作為聯(lián)盟發(fā)起人和組織者,百度大腦希望與聯(lián)盟伙伴一起,共同制訂端計(jì)算與AI硬件標(biāo)準(zhǔn),共同促進(jìn)和繁榮AI落地應(yīng)用。



百度大腦也將對(duì)聯(lián)盟合作伙伴提供深度技術(shù)支持、渠道支持、品牌授權(quán)、產(chǎn)品折扣和運(yùn)營(yíng)資源等權(quán)益,全面開啟AI技術(shù)終端化的大門,賦能合作伙伴的同時(shí)為產(chǎn)業(yè)帶來(lái)加速的交流和融合。正如百度AI技術(shù)生態(tài)部總經(jīng)理喻友平所言,人工智能若要長(zhǎng)期推動(dòng)各個(gè)產(chǎn)業(yè)的升級(jí)與優(yōu)化,需要合作伙伴的共同努力,打造適合AI發(fā)展的健康環(huán)境。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 百度
    +關(guān)注

    關(guān)注

    9

    文章

    2234

    瀏覽量

    89839
  • 語(yǔ)音識(shí)別
    +關(guān)注

    關(guān)注

    38

    文章

    1696

    瀏覽量

    112248
  • 智能音箱
    +關(guān)注

    關(guān)注

    31

    文章

    1781

    瀏覽量

    78279
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    遠(yuǎn)場(chǎng)應(yīng)用的模擬麥克風(fēng)和ADC系統(tǒng)

    電子發(fā)燒友網(wǎng)站提供《遠(yuǎn)場(chǎng)應(yīng)用的模擬麥克風(fēng)和ADC系統(tǒng).pdf》資料免費(fèi)下載
    發(fā)表于 08-28 09:39 ?0次下載
    <b class='flag-5'>遠(yuǎn)</b><b class='flag-5'>場(chǎng)</b>應(yīng)用<b class='flag-5'>中</b>的模擬麥克風(fēng)和ADC系統(tǒng)

    使用bq40z50-R2過(guò)程,Q4可以防止在適配器反接的時(shí)候,損壞Q3?

    在使用bq40z50-R2過(guò)程,規(guī)格書上聲稱,Q4可以防止在適配器反接的時(shí)候,損壞Q3?這句話怎么理解??它怎么就能起到保護(hù)作用了??感覺加這個(gè)mos管沒什么用啊,還浪費(fèi)成本,可以麻煩解釋一下嗎???
    發(fā)表于 08-15 07:02

    樂(lè)鑫聲學(xué)前端算法:打造智能語(yǔ)音交互新體驗(yàn),ESP32-S3 SOC技術(shù)方案

    ,它正為解決這一問(wèn)題提供了強(qiáng)大的技術(shù)支持。遠(yuǎn)場(chǎng)噪聲的清晰對(duì)話在遠(yuǎn)場(chǎng)噪聲環(huán)境
    的頭像 發(fā)表于 08-03 08:04 ?544次閱讀
    樂(lè)鑫聲學(xué)前端算法:打造<b class='flag-5'>智能</b><b class='flag-5'>語(yǔ)音</b>交互新體驗(yàn),ESP32-S<b class='flag-5'>3</b> SOC<b class='flag-5'>技術(shù)</b>方案

    這個(gè)電路Q1和Q3會(huì)同時(shí)導(dǎo)通嗎?

    在這個(gè)電路圖中,MCU_CTL是MCU發(fā)出的數(shù)字控制信號(hào),有沒有可能在某種條件下,上管Q1和下管Q3同時(shí)導(dǎo)通?
    發(fā)表于 03-29 16:31

    思澤遠(yuǎn)語(yǔ)音芯片:讓智能生活觸手可及

    隨著科技的飛速發(fā)展,人工智能已經(jīng)逐漸走進(jìn)我們的生活。在這個(gè)過(guò)程,語(yǔ)音識(shí)別技術(shù)作為人工智能的重要分支,也得到了迅速的發(fā)展。今天,我們要介紹的
    的頭像 發(fā)表于 03-19 15:20 ?276次閱讀
    思澤<b class='flag-5'>遠(yuǎn)</b><b class='flag-5'>語(yǔ)音</b>芯片:讓<b class='flag-5'>智能</b>生活觸手可及

    N9H20 GPIO上電竟然是高電平,有沒有辦法解決?

    一直很納悶,GPIO上電竟然是高電平。有沒有辦法解決,是不是要改動(dòng)啟動(dòng)程序才能解決問(wèn)題?
    發(fā)表于 01-17 08:27

    LTC3632 Q5的作用是什么?Q2和Q3是開關(guān)管嗎?

    各位大佬, 萌新一枚,在查L(zhǎng)T8612的時(shí)候看到了這個(gè)原理圖,研究了一下,有幾個(gè)問(wèn)題想不明白,請(qǐng)教一下各位大佬。 請(qǐng)問(wèn)一下Q5的作用是什么,Q2和Q3是開關(guān)管嗎,還有就是LTC3632的Iset的806K的電阻是是干嘛的,是設(shè)
    發(fā)表于 01-05 06:36

    Q3 NAND產(chǎn)業(yè)營(yíng)收環(huán)比增長(zhǎng)2.9%,預(yù)計(jì)Q4量?jī)r(jià)齊漲

    2023q3,三星依然是市場(chǎng)第1位,鎧俠、美光只是銷售下滑的第2個(gè)企業(yè)。nand的銷售額維持了與q2相同的水平,約29億美元。市場(chǎng)占有率為31.4%,平均單價(jià)反彈1~3%。
    的頭像 發(fā)表于 12-05 17:16 ?883次閱讀
    <b class='flag-5'>Q3</b> NAND產(chǎn)業(yè)營(yíng)收環(huán)比增長(zhǎng)2.9%,預(yù)計(jì)<b class='flag-5'>Q</b>4量?jī)r(jià)齊漲

    印度可穿戴市場(chǎng)Q3增長(zhǎng)近30%,出貨4810萬(wàn)臺(tái)

    智能手表依然是增長(zhǎng)最快的產(chǎn)品。q3出庫(kù)1690萬(wàn)元人民幣,同比增加41.0%。其原因是現(xiàn)有的供貨商為即將到來(lái)的節(jié)日旺季積極準(zhǔn)備商品。由于多個(gè)頻道的優(yōu)惠活動(dòng),q3智能手表的平均售價(jià)同比下
    的頭像 發(fā)表于 11-16 16:35 ?733次閱讀
    印度可穿戴市場(chǎng)<b class='flag-5'>Q3</b>增長(zhǎng)近30%,出貨4810萬(wàn)臺(tái)

    你不知道的FPC,它的發(fā)展史竟然是這樣的!

    你不知道的FPC,它的發(fā)展史竟然是這樣的!
    的頭像 發(fā)表于 11-15 10:48 ?848次閱讀

    2023Q3全球顯示器需求呈逐步恢復(fù)態(tài)勢(shì)

    以下為TOP代工廠具體出貨表現(xiàn): 2023Q3全球顯示器Top代工廠出貨及同比
    發(fā)表于 11-08 18:16 ?550次閱讀
    2023<b class='flag-5'>年</b><b class='flag-5'>Q3</b>全球顯示器需求呈逐步恢復(fù)態(tài)勢(shì)

    全球手機(jī)市場(chǎng)Q3數(shù)據(jù)顯示分析

    2023Q3中國(guó)智能手機(jī)出貨量同比下降5%。廠商方面,榮耀以18%的市場(chǎng)份額重新奪回了中國(guó)智能
    發(fā)表于 11-08 14:42 ?267次閱讀
    全球手機(jī)市場(chǎng)<b class='flag-5'>Q3</b>數(shù)據(jù)顯示分析

    機(jī)構(gòu):Q3中國(guó)智能手機(jī)市場(chǎng)榮耀第一,華為飆升50%

    榮耀在q3以17.6%的市場(chǎng)占有率位居第一,出貨量為1120萬(wàn)部,同比下降7.4%。oppo共推出1090萬(wàn)部,市場(chǎng)占有率為17.1%,緊隨其后。vivo出貨量為1070萬(wàn)部,占16.8%,同比下降為25.2%。蘋果以970萬(wàn)部占據(jù)了第4位,占15.2%。
    的頭像 發(fā)表于 11-08 14:25 ?826次閱讀
    機(jī)構(gòu):<b class='flag-5'>Q3</b><b class='flag-5'>中國(guó)</b><b class='flag-5'>智能</b>手機(jī)市場(chǎng)榮耀第一,華為飆升50%

    語(yǔ)音識(shí)別技術(shù)智能家居領(lǐng)域的應(yīng)用與前景

    及未來(lái)的發(fā)展前景。 二、語(yǔ)音識(shí)別技術(shù)智能家居領(lǐng)域的應(yīng)用 1.智能音箱控制:智能家居系統(tǒng)
    的頭像 發(fā)表于 10-26 14:27 ?1038次閱讀

    程序員節(jié) | 今年程序員們都想要的禮物竟然是……

    原文標(biāo)題:程序員節(jié) | 今年程序員們都想要的禮物竟然是…… 文章出處:【微信公眾號(hào):微軟科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
    的頭像 發(fā)表于 10-24 10:35 ?406次閱讀
    程序員節(jié) | 今年程序員們都想要的禮物<b class='flag-5'>竟然是</b>……