0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

語音AI芯片演進(jìn)至第三階段,誰將主宰下一個(gè)十年?

啟英泰倫 ? 2022-08-05 10:36 ? 次閱讀

轉(zhuǎn)載自與非網(wǎng)

什么是語音AI芯片?

語音AI芯片,顧名思義是處理語音的AI芯片。很多人第一次接觸語音AI芯片可能是天貓精靈、小愛同學(xué)和小度等智能音箱產(chǎn)品,因?yàn)樵谶@些產(chǎn)品中,我們可以體驗(yàn)到智能語音的交互,而語音AI芯片是智能語音交互的基礎(chǔ)和核心。

都說這幾年AI芯片賽道很火,事實(shí)上語音識(shí)別、自然語義理解(NLP)和機(jī)器學(xué)習(xí)AI技術(shù)中占據(jù)重要的位置,是人機(jī)交互的基礎(chǔ),而前兩項(xiàng)均與語音識(shí)別相關(guān),這是因?yàn)檎Z音識(shí)別不僅方便,而且是人機(jī)交互中最符合人類日常交流形態(tài)的一種技術(shù),目前已經(jīng)在智能家居和車載場景得到普遍應(yīng)用。

為何語音識(shí)別要從云端搬至終端?

說到語音識(shí)別技術(shù),還要追溯到2010年左右,當(dāng)時(shí)以神經(jīng)網(wǎng)絡(luò)為代表的AI技術(shù)使得智能語音識(shí)別成為可能,并在后來的IoT和AIoT產(chǎn)業(yè)浪潮中不斷走向成熟。

早期的智能語音識(shí)別受限于算力要求,終端沒有專用的芯片可以解決算力和功耗成本的均衡問題,無法在終端處理智能語音識(shí)別,而云端處理又憑借天然自帶內(nèi)容和服務(wù),模型可以快速迭代,數(shù)據(jù)收集和訓(xùn)練非常方便等優(yōu)勢,決定了當(dāng)時(shí)的語音識(shí)別大都是布置在云端的。

然而,云端的語音識(shí)別也有弊端,比如無法做到穩(wěn)定的實(shí)時(shí)響應(yīng),網(wǎng)絡(luò)崩潰時(shí)更是響應(yīng)無門;重要的信息都要通過網(wǎng)絡(luò)傳輸,有被攻擊泄露的風(fēng)險(xiǎn),無法保障用戶隱私安全;此外在成本方面也不具優(yōu)勢,除了持續(xù)的帶寬消耗外,云端語音需要后臺(tái)不間斷的運(yùn)行大量服務(wù)器來做語音處理,服務(wù)器的購置、后續(xù)的硬件更換和軟件運(yùn)維、人力費(fèi)用和電費(fèi)場地費(fèi)等都非常昂貴。

9958de6a-143a-11ed-9ade-dac502259ad0.jpg

圖 | 為什么選擇離線語音

面對(duì)云端語音的優(yōu)劣勢,以啟英泰倫為代表的企業(yè)開始投入對(duì)端側(cè)語音識(shí)別的研究。不過,我們知道光有需求點(diǎn)還支撐不起一個(gè)新產(chǎn)業(yè)的崛起,要養(yǎng)活一個(gè)產(chǎn)業(yè)需要足夠的市場容量,實(shí)現(xiàn)資金的活流,才能有利于產(chǎn)品的不斷迭代,形成正向循環(huán)。

根據(jù)艾瑞咨詢發(fā)布數(shù)據(jù)顯示,2020年中國物聯(lián)網(wǎng)設(shè)備連接量達(dá)74億個(gè),預(yù)計(jì)2025年將突破150億個(gè)。而麥肯錫則用更動(dòng)態(tài)的數(shù)據(jù)表示出了物聯(lián)網(wǎng)的增長率,預(yù)估目前每秒大約有127臺(tái)設(shè)備連接到互聯(lián)網(wǎng)。

然而,面對(duì)當(dāng)前物聯(lián)網(wǎng)的聯(lián)網(wǎng)量,華為給出了另一個(gè)數(shù)據(jù):當(dāng)前大部分具備物聯(lián)能力的消費(fèi)類設(shè)備只有 5% ~ 20% 的聯(lián)接激活率。這是為什么呢?究其原因,還是操作交互太過于復(fù)雜。而解決這個(gè)復(fù)雜問題的方法就是加入更多“老少皆宜”的語音配合IoT連接。

有行業(yè)內(nèi)人士預(yù)測,語音AI芯片將會(huì)快速發(fā)展到5-10億顆/年左右的市場規(guī)模,隨著應(yīng)用面的不斷拓寬和滲透率的不斷提升,該規(guī)模還將持續(xù)不斷提升。

綜上,不管是場景需求還是市場容量,都在推動(dòng)端側(cè)語音識(shí)別的落地。但如何落地?不是一蹴而就的。

端側(cè)語音識(shí)別芯片的三個(gè)發(fā)展階段

語音識(shí)別面臨的挑戰(zhàn)和圖像識(shí)別不同,它對(duì)算力要求沒那么高,但對(duì)算法的要求很高。啟英泰倫創(chuàng)始人兼CEO何云鵬告訴與非網(wǎng):“這是因?yàn)檎Z音識(shí)別的應(yīng)用場景非常多,所以各種噪聲就非常多樣,有穩(wěn)態(tài)噪聲,也有非穩(wěn)態(tài)噪聲,要在這些環(huán)境中進(jìn)行高準(zhǔn)確率的語音識(shí)別是非常困難的。所以,必須掌握智能語音算法全鏈條技術(shù)才能實(shí)現(xiàn)更好的語音識(shí)別,包括智能語音信號(hào)前端降噪處理、語音智能識(shí)別、語音合成、語音解碼、語音大數(shù)據(jù)處理及訓(xùn)練、NLP等技術(shù)?!?/p>

當(dāng)然,語音識(shí)別技術(shù)在國內(nèi)的發(fā)展也是在不斷迭代中變得更加準(zhǔn)確和靈活。我們以啟英泰倫的三代自研技術(shù)平臺(tái)BNPU(腦神經(jīng)網(wǎng)絡(luò)處理器),來簡單概括端側(cè)語音AI芯片的這三個(gè)發(fā)展階段。

99752e44-143a-11ed-9ade-dac502259ad0.jpg

圖 | 啟英泰倫在語音AI芯片上的創(chuàng)新

階段一:語音識(shí)別功能

第一代BNPU芯片實(shí)現(xiàn)的是端側(cè)語音識(shí)別,是行業(yè)首款集成神經(jīng)網(wǎng)絡(luò)處理器的語音AI芯片,也是離線語音產(chǎn)業(yè)應(yīng)用興起的標(biāo)志。

從集成度的角度來看,BNPU 1.0的方案相對(duì)分立,方案價(jià)格大約在50到90元左右(CI1006)。

階段二:離線聲紋識(shí)別+命令詞自學(xué)習(xí)

第二代BNPU芯片(CI1102/CI1103和CI1122),不僅實(shí)現(xiàn)了離線語音識(shí)別功能,還能實(shí)現(xiàn)離線聲紋識(shí)別和命令詞自學(xué)習(xí)等個(gè)性化的功能。在應(yīng)用上,可以根據(jù)不同人的聲紋實(shí)現(xiàn)基于用戶個(gè)性喜好的功能配置,并能通過離線命令詞的自學(xué)習(xí)實(shí)現(xiàn)在輕度噪聲下的地方口音和方言的識(shí)別。

從集成度的角度來看,BNPU 2.0集成了Audio CODEC、Flash 等單元,以及雙麥陣增強(qiáng)處理能力,方案價(jià)格大約在15到25元左右。

階段三:深度降噪+深度分離+命令詞自學(xué)習(xí)2.0+離線NLP

第三代BNPU芯片,除了繼承第二代的語音識(shí)別、聲紋識(shí)別外,還支持了基于深度學(xué)習(xí)的降噪技術(shù)(深度降噪)、人聲分離技術(shù)(深度分離)、命令詞自學(xué)習(xí)2.0版本技術(shù),以及行業(yè)首次突破性的離線NLP技術(shù)。在應(yīng)用上,CI1301可以實(shí)現(xiàn)中等噪聲中的語音識(shí)別,而CI1302、CI1303、CI1306和CI1312則可實(shí)現(xiàn)強(qiáng)噪聲環(huán)境下的語音識(shí)別,比如當(dāng)油煙機(jī)噪聲高達(dá)80dB時(shí),對(duì)于70多dB的人聲依然可以良好識(shí)別。

從集成度的角度來看,BNPU 3.0不僅集成了Audio Codec的模擬 MIC接口、數(shù)字PDM麥克的DMIC接口、通用的ADCMCU常見的串口、PWM、GPIO等接口,還進(jìn)一步集成了 4線Nor Flash、3路LDO的PMU和高精度的RC振蕩器等,方案價(jià)格約10元左右。

對(duì)于三代產(chǎn)品的方案價(jià)格一代更比一代低的疑問,何云鵬表示:“很多人認(rèn)為離線語音在端側(cè)、數(shù)據(jù)處理、語音識(shí)別和存儲(chǔ)會(huì)產(chǎn)生很多的成本,實(shí)則云上的成本是持續(xù)的,傳輸?shù)某杀臼情L時(shí)間的,這個(gè)成本可以避免;此外,云端早期建設(shè)的成本很高,很多廠家會(huì)建不起,還有每年運(yùn)營的成本,每臺(tái)設(shè)備每年10多元,這個(gè)費(fèi)用在賣設(shè)備的時(shí)候廠商會(huì)包兩年,但后面就要客戶自己付費(fèi),所以不太公平。而隨著摩爾定律的發(fā)展,端側(cè)語音識(shí)別方案的整體成本已呈現(xiàn)30%的速率下降,已經(jīng)達(dá)到了一個(gè)通用MCU的成本?!?/p>

除了價(jià)格以外,更值得一提的是,原本被認(rèn)為只有云端才能實(shí)現(xiàn)的NLP,現(xiàn)在輕量級(jí)的NLP在端側(cè)智能語音芯片中也實(shí)現(xiàn)了,并且既保障了用戶的體驗(yàn)感,又能降低云端搭建和運(yùn)營成本,降低網(wǎng)絡(luò)帶寬消耗,也能提升用戶使用的安全性。

端云融合才是語音AI芯片的最終歸宿

當(dāng)然,說云端搬到端側(cè),實(shí)際上在很多場景下端側(cè)和云端不是非此即彼的關(guān)系,從長期來看,端側(cè)和云端是相互融合、相輔相成的關(guān)系。

隨著端側(cè)語音芯片功能、性能、可靠性變得越來越強(qiáng)大,價(jià)格越來越低,端側(cè)語音識(shí)別將實(shí)現(xiàn)可靠性、隱私保護(hù)、成本和靈活性等多方面的優(yōu)勢,再加上集成聯(lián)網(wǎng)功能可實(shí)現(xiàn)AIOT,從而實(shí)現(xiàn)大數(shù)據(jù)爆發(fā)時(shí)代下的有效數(shù)據(jù)分析和場景利用。

以空調(diào)為例,傳統(tǒng)的空調(diào)大都只有調(diào)溫的功能,但在差異化競爭的今天,大廠空調(diào)正在往機(jī)器人的方向發(fā)展,可以提供更多智慧化的服務(wù),比如調(diào)整空氣的溫濕度、清新程度、含氧量、PM 2.5值,以及在早晨起床時(shí)放音樂營造氛圍、營養(yǎng)咨詢等。而這些服務(wù)的基礎(chǔ)是語音交互,并且一定是延遲更低、工作更穩(wěn)定的端側(cè)語音識(shí)別,而背后的服務(wù)交易、用戶的習(xí)慣大數(shù)據(jù)等則更適合放在云端,達(dá)到協(xié)同的效果。

寫在最后

國內(nèi)語音AI芯片正呈現(xiàn)出爆發(fā)式增長的趨勢,誰將成為領(lǐng)頭者?何云鵬表示:“該市場領(lǐng)域未來發(fā)展壯大后,會(huì)呈現(xiàn)典型的頭部領(lǐng)先市場通吃的局面。而啟英泰倫在語料數(shù)據(jù)、算法模型、芯片架構(gòu)、AI開發(fā)平臺(tái)及應(yīng)用方案落地等多維度的迭代已經(jīng)產(chǎn)生了馬太效應(yīng)。經(jīng)過長達(dá)近7年的發(fā)展后,啟英泰倫已經(jīng)積累了B端客戶超過5000名,平臺(tái)開發(fā)者超過1萬名,使用啟英泰倫智能語音平臺(tái)的在校AI學(xué)員則超過10萬名。如今,整個(gè)離線語音行業(yè)快速發(fā)展,年內(nèi)裝機(jī)量將突破2000萬臺(tái),未來兩年,年出貨將朝著1億臺(tái)邁進(jìn)?!?/p>

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    28877

    瀏覽量

    266221
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    國產(chǎn)車規(guī)級(jí)MCU發(fā)展進(jìn)入階段,曦華科技如何用“MCU+”引領(lǐng)細(xì)分應(yīng)用賽道

    ,車規(guī)模MCU市場需求明顯增加,成為國產(chǎn)MCU廠商重點(diǎn)布局的方向。 ? 曦華科技CEO陳曦表示,國產(chǎn)車規(guī)級(jí)MCU發(fā)展有三個(gè)階段:第一個(gè)階段是缺貨階段
    的頭像 發(fā)表于 05-29 01:09 ?3409次閱讀

    AI手機(jī)時(shí)代將至,2024或成行業(yè)轉(zhuǎn)型關(guān)鍵

    從行業(yè)發(fā)展階段來看,AI手機(jī)也將成為繼功能機(jī)、智能手機(jī)之后,手機(jī)行業(yè)的第三階段。
    發(fā)表于 02-22 09:13 ?432次閱讀
    <b class='flag-5'>AI</b>手機(jī)時(shí)代將至,2024<b class='flag-5'>年</b>或成行業(yè)轉(zhuǎn)型關(guān)鍵<b class='flag-5'>年</b>

    OPPO宣告AI手機(jī)新時(shí)代來臨,2024AI手機(jī)行業(yè)第三階段成定局

    在2024春節(jié)期間,OPPO將舉辦AI領(lǐng)域的盛大發(fā)布會(huì),屆時(shí)將向OPPO及加的數(shù)千萬用戶推出全新的ColorOS AI新春版系統(tǒng),其中包含數(shù)百項(xiàng)
    的頭像 發(fā)表于 02-18 14:22 ?599次閱讀

    OPPO創(chuàng)始人陳明永:OPPO成立AI中心,加速資源向AI的集中

    今日,OPPO創(chuàng)始人兼首席執(zhí)行官陳明永發(fā)表開年致全體員工的封信。信中表示:2024AI手機(jī)元年,AI手機(jī)時(shí)代將成為繼功能機(jī)、智能手機(jī)之后,手機(jī)行業(yè)的
    的頭像 發(fā)表于 02-18 10:18 ?359次閱讀
     OPPO創(chuàng)始人陳明永:OPPO成立<b class='flag-5'>AI</b>中心,加速資源向<b class='flag-5'>AI</b>的集中

    商用車將成為下一階段頭部電池企業(yè)電動(dòng)化滲透的重要方向

    商用車將成為下一階段電動(dòng)化滲透的重要方向。
    的頭像 發(fā)表于 01-16 09:39 ?713次閱讀

    加12發(fā)布:十年超越之作,依然全面不將就

    ,加正式發(fā)布十年旗艦之作——加12。加12搭載了 第三代驍龍8移動(dòng)平臺(tái) ,擁有醫(yī)療級(jí)護(hù)眼方案、4500nit峰值亮度的2K東方屏,以及
    的頭像 發(fā)表于 12-05 21:20 ?802次閱讀
    <b class='flag-5'>一</b>加12發(fā)布:<b class='flag-5'>十年</b>超越之作,依然全面不將就

    晶體管的下一個(gè)25

    晶體管的下一個(gè)25
    的頭像 發(fā)表于 11-27 17:08 ?516次閱讀
    晶體管的<b class='flag-5'>下一個(gè)</b>25<b class='flag-5'>年</b>

    國產(chǎn)工業(yè)無線傳輸芯片企業(yè)磐啟微電子十年磨一

    過去的十年,是國內(nèi)半導(dǎo)體產(chǎn)業(yè)飛速發(fā)展的十年。眾多國產(chǎn)芯片公司在風(fēng)口上競相登臺(tái),博得無數(shù)鮮花和掌聲。
    的頭像 發(fā)表于 11-16 11:10 ?1318次閱讀
    國產(chǎn)工業(yè)無線傳輸<b class='flag-5'>芯片</b>企業(yè)磐啟微電子<b class='flag-5'>十年磨一</b>劍

    下一個(gè)十年誰會(huì)是智能手機(jī)戰(zhàn)場上的核芯

    電子發(fā)燒友網(wǎng)站提供《下一個(gè)十年誰會(huì)是智能手機(jī)戰(zhàn)場上的核芯.doc》資料免費(fèi)下載
    發(fā)表于 11-03 10:35 ?0次下載
    <b class='flag-5'>下一個(gè)</b><b class='flag-5'>十年</b>誰會(huì)是智能手機(jī)戰(zhàn)場上的核芯

    Light Reading專訪華為沈城營:攜手邁向NFV下一個(gè)黃金十年

    華為NFV5GC SDT領(lǐng)域總裁沈城營在第14屆全球移動(dòng)寬帶論壇(MBBF 2023)期間接受Light Reading采訪,他表示,行業(yè)各方需要更緊密地合作,迎接NFV的下一個(gè)黃金十年。 值此
    的頭像 發(fā)表于 10-20 02:00 ?442次閱讀

    歐瑞博新代智能開關(guān)搭載啟英泰倫第三AI語音芯片

    近日,全球知名品牌全屋智能家居科技公司歐瑞博發(fā)布了新代智能開關(guān),該智能開關(guān)搭載啟英泰倫自研的第三AI語音芯片,具備強(qiáng)大的離線
    的頭像 發(fā)表于 10-19 14:47 ?815次閱讀

    邁向F5.5G,華為發(fā)布三階段全光目標(biāo)網(wǎng)架構(gòu)

    在UBBF 2023期間,華為光產(chǎn)品線總裁靳玉志發(fā)表了題為“將F5.5G帶入現(xiàn)實(shí),邁向智能世界的關(guān)鍵里程碑”主題演講,首次提出三階段建網(wǎng)理念,指明視頻驅(qū)動(dòng)百兆建網(wǎng)、體驗(yàn)驅(qū)動(dòng)千兆建網(wǎng)和智能驅(qū)動(dòng)萬兆建網(wǎng)
    的頭像 發(fā)表于 10-17 17:01 ?896次閱讀

    UBBF 2023 | 邁向F5.5G,華為發(fā)布三階段全光目標(biāo)網(wǎng)架構(gòu)

    [阿聯(lián)酋,迪拜,202310月13日] ?在UBBF 2023期間,華為光產(chǎn)品線總裁靳玉志發(fā)表了題為“將F5.5G帶入現(xiàn)實(shí),邁向智能世界的關(guān)鍵里程碑”主題演講,首次提出三階段建網(wǎng)理念,指明視頻驅(qū)動(dòng)
    的頭像 發(fā)表于 10-13 23:55 ?349次閱讀
    UBBF 2023 | 邁向F5.5G,華為發(fā)布<b class='flag-5'>三階段</b>全光目標(biāo)網(wǎng)架構(gòu)

    華為高治國:開啟NFV下一個(gè)黃金十年,邁向未來智能世界

    高治國在發(fā)言中呼吁產(chǎn)業(yè)界攜手合作,打造下一代電信基礎(chǔ)設(shè)施,共創(chuàng)NFV下一個(gè)黃金十年,邁向未來智能世界。 華為云核心網(wǎng)產(chǎn)品線總裁高治國 電信云原生商業(yè)對(duì)話,推動(dòng)NFV產(chǎn)業(yè)持續(xù)發(fā)展 5G進(jìn)入發(fā)展快車道,創(chuàng)新業(yè)務(wù)層出不窮?;谠圃?/div>
    的頭像 發(fā)表于 10-11 23:35 ?402次閱讀

    中國臺(tái)灣南科為目前唯可量產(chǎn)3nm芯片地區(qū),期擴(kuò)建已動(dòng)工

    據(jù)了解,南科第三階段擴(kuò)建方案已經(jīng)動(dòng)工,今后開發(fā)完成后,第三階段園區(qū)的產(chǎn)值有望超過390億韓元。此外,位于新北夏倫的“智慧綠能科學(xué)城”也將引領(lǐng)臺(tái)灣地區(qū)智能科學(xué)技術(shù)產(chǎn)業(yè)的發(fā)展。
    的頭像 發(fā)表于 10-09 09:35 ?512次閱讀