智能音箱自2017年以來的井噴式爆發(fā),讓語音交互成為市場的焦點(diǎn),越來越多的行業(yè)硬件設(shè)備開始智能語音化。語音應(yīng)用場景的爆發(fā),也帶動了AI專用語音芯片的加速崛起。2018年年中,國內(nèi)一眾語音公司幾乎在同一時間向市場公布了其AI語音芯片的動作,正式開啟了AI語音芯片元年。
其中,出門問問于2018年5月發(fā)布的AI語音芯片模組“問芯”是中國首個已量產(chǎn)的AI語音芯片模組,由出門問問和杭州國芯合作打造,可為核心應(yīng)用場景提供一站式、集成難度小、調(diào)試周期短、溝通成本低的AI語音交互解決方案,并且實(shí)現(xiàn)成本降低50%以上。由于芯片的長周期特性,相較于其他還處于規(guī)劃或流片階段的芯片,出門問問的問芯無疑占據(jù)了領(lǐng)跑優(yōu)勢,成為AI語音芯片爆發(fā)年的領(lǐng)航者。
問芯集成了出門問問的麥克風(fēng)陣列信號處理技術(shù),語音交互SDK與可定制語義技能,其中包括了公司長期積累的回聲消除、聲源定向、波束成形、語音降噪、語音喚醒、語音識別、語義理解與語音合成等自有AI語音交互核心技術(shù)。作為中國AI語音賽道獨(dú)角獸公司,目前出門問問可實(shí)現(xiàn)語音喚醒準(zhǔn)確率95%以上,誤喚醒率低于1次/24小時,端到端響應(yīng)速度在業(yè)界領(lǐng)先,提供超過60個垂直領(lǐng)域,基本可以覆蓋用戶衣食住行相關(guān)的語音交互,并且支持用戶在出門問問AI開放平臺進(jìn)行靈活的語義技能自定義。
問芯主要包括兩款產(chǎn)品——問芯Mobvoi A1和問芯Mobvoi B1。其中,Mobvoi A1是一款專門為語音交互設(shè)計(jì)的前端音頻信號處理和神經(jīng)網(wǎng)絡(luò)處理芯片,集成了出門問問的麥克風(fēng)陣列算法、語音喚醒等,配合后端語音交互SDK,能夠保證遠(yuǎn)場語音交互在噪音環(huán)境下的體驗(yàn),適用于智能電視、智能機(jī)頂盒、智能冰箱、智能鏡子、智能零售終端等產(chǎn)品場景。Mobvoi B1是一款支持完整語音交互應(yīng)用的SoC芯片,除了擁有Mobvoi A1強(qiáng)勁的麥克風(fēng)陣列信號處理功能外,還集成了語音喚醒、在線/離線語音識別、在線/離線語義理解、在線內(nèi)容搜索、在線/離線語音合成等出門問問提供的全棧式語音交互功能,可廣泛應(yīng)用于智能白電、智能小家電、智能晾衣架、智能沙發(fā)等產(chǎn)品場景中。
具體來說,Mobvoi A1集成了麥克風(fēng)陣列、DSP內(nèi)核和NPU內(nèi)核,通過出門問問自主研發(fā)的麥克風(fēng)陣列算法,包括回聲消除、聲源定向、波束成型、降噪等,實(shí)現(xiàn)3-5米內(nèi)強(qiáng)勁的降噪功能。例如在電視、機(jī)頂盒、零售終端等大噪音的使用環(huán)境下,即使是設(shè)備播放聲音時,麥克風(fēng)處音量達(dá)到90dB,回聲抑制也可達(dá)到40dB以上,能在3米距離實(shí)現(xiàn)正常人聲喚醒率85%以上。Mobvoi A1支持線性陣列和環(huán)形陣列的高精度聲源定向,定向精度在±10°以內(nèi),通過波束成型算法增強(qiáng)目標(biāo)方向語音,抑制±15°波束外噪音超過14dB以上。而對于空氣凈化器、空調(diào)等平穩(wěn)噪音的使用環(huán)境下,Mobvoi A1的降噪算法也可以實(shí)現(xiàn)8dB以上的抑制。
此外,Mobvoi A1還可提供友好的用戶接口。相對于市面上絕大多數(shù)只提供IIS音頻接口的產(chǎn)品,Mobvoi A1提供了更標(biāo)準(zhǔn)、更常見的USB接口。尤其是對于本身自帶USB接口的電視、機(jī)頂盒、冰箱、鏡子、新零售終端等產(chǎn)品,Mobvoi A1能做到USB即插即用,并實(shí)現(xiàn)在線的OTA固件升級,極大的減少了溝通調(diào)試成本,降低了客戶在產(chǎn)品中集成AI語音能力的難度。
Mobvoi A1的使用方式極為靈活,可為不同產(chǎn)品場景的客戶實(shí)現(xiàn)高度定制化。首先,在麥克風(fēng)陣列形式上,客戶可通過配置參數(shù)的方式選擇2麥克風(fēng)、4麥克風(fēng)、6麥克風(fēng),以及線性布局或者環(huán)形布局。其次,針對零售嘈雜的環(huán)境,客戶可自由選擇語音或人臉識別喚醒,并實(shí)現(xiàn)指定方向波束成形降噪。同時,客戶也可按照需求,設(shè)置指令,針對某些功能場景暫時關(guān)閉麥克風(fēng)陣列算法,例如語音通話場景。最后,客戶可根據(jù)產(chǎn)品場景靈活的選擇USB輸入方式、模擬輸入方式(包括喇叭前端或者后端電路分壓兩種)等回聲消除方案。
而Mobvoi B1和Mobvoi A1一脈相承,在Mobvoi A1強(qiáng)勁的麥克風(fēng)陣列降噪基礎(chǔ)之上,還集成了出門問問的語音喚醒、在線/離線語音識別、在線/離線語義理解、在線內(nèi)容搜索、在線/離線語音合成等全棧式語音交互技術(shù),支持簡單易用的標(biāo)準(zhǔn)UART接口和藍(lán)牙通信配網(wǎng)方案,在一顆芯片模組中實(shí)現(xiàn)了離在線融合的語音交互功能。這是一顆完整功能的SoC芯片,加上WiFi模塊就可以很容易的實(shí)現(xiàn)一個高性能低成本的音箱方案,或有類似需求的智能家居方案。
離線語音交互功能的實(shí)現(xiàn),對于智能家居產(chǎn)品來說,可讓用戶不配網(wǎng)就能直接實(shí)現(xiàn)簡單的離線語音控制,大大降低了使用門檻,十分便捷。目前,Mobvoi B1允許客戶自己編輯離線命令詞識別的語法文件,在家居環(huán)境下識別準(zhǔn)確率可達(dá)到95%以上。同時,Mobvoi集成的離線語音識別和語義理解,能夠針對性實(shí)現(xiàn)識別和理解優(yōu)化,讓用戶可不局限于固定命令詞,用最自然的語言進(jìn)行交互,極大地提升用戶使用體驗(yàn)。
目前,出門問問可提供問芯對應(yīng)的芯片模組和評估板參考設(shè)計(jì),完善的產(chǎn)品手冊、文檔等。感興趣的客戶可聯(lián)系出門問問(ai-chips@mobvoi.com)進(jìn)行了解。
評論
查看更多