0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

智能語音的“未來三步”及優(yōu)勢

MZjJ_DIGITIMES ? 來源:未知 ? 作者:胡薇 ? 2018-07-04 15:04 ? 次閱讀

隨著智能音箱的火熱以及背后語音交互生態(tài)的成熟,將會帶動越來越多的設備語音化、智能化,使語音真正成為人機交互的一個界面。而在語音交互設備中,語音芯片憑借定制化、低功耗、高能效、智能化以及成本優(yōu)勢等地位越發(fā)重要,成為人與云端“溝通”的橋梁。

自從谷歌在今年5月初的I/O開發(fā)者大會上秀了一回語音助手Google Assistant,智能語音便再次成為熱議話題,與此同時,國內(nèi)的智能語音市場亦趁著這陣風迅速升溫。

5月16日,云知聲在北京發(fā)布了首款面向物聯(lián)網(wǎng)領域的AI系列芯片UniOne以及第一代芯片“雨燕”;5月24日,出門問問在北京發(fā)布了旗下首款AI語音芯片模組問芯Mobvoi A1;6月26日,Rokid在杭州發(fā)布了旗下AI語音專用SoC芯片KAMINO18;同一天,思必馳宣布完成D輪5億融資,由元禾控股、中國民生投資集團領投,深創(chuàng)投、富士康、聯(lián)發(fā)科跟投。

如今伴隨大眾的廣泛認可和資本的涌入,似乎AI語音專用芯片的戰(zhàn)斗已然打響。

智能語音芯片戰(zhàn)爭背后的考量

隨著AI技術在終端的落地,終端芯片也成為賦予設備AI能力、提升用戶體驗的重要關鍵點。云知聲CEO黃偉曾表示,智能終端的破局點在于“芯”。他認為對于AI技術來說,場景的選擇最為重要,由AI芯片和場景就能形成一個完善的產(chǎn)業(yè)閉環(huán),首先AI技術的落地需要找到具體場景,其次應用場景也將定義AI芯片,而芯片反過來也將加速應用的落地。

從目前智能語音交互行業(yè)整體格局來看,在實現(xiàn)商業(yè)化方面,可以往上下游延伸以創(chuàng)造價值。比如:上游把語音和搜索引擎結(jié)合起來,為垂直行業(yè)提供內(nèi)容和服務;下游則可把語音和硬件產(chǎn)品相結(jié)合。

AI開始“潤物細無聲”,融入各個場景。智能音箱之外,在家庭場景、辦公場景中更多的硬件設備也開始語音化、智能化,通過深耕垂直領域和細分賽道,這更加帶動了AI專用語音芯片的爆發(fā)。

智能語音芯片的優(yōu)勢

在智能語音設備的市場早期階段,由于芯片研發(fā)漫長的周期(一般需要18~24個月),高昂的研發(fā)投入,因此在市場規(guī)模尚不大的情況下,市場并沒有專門的語音芯片應用到智能語音設備中。

隨著智能語音設備銷量不斷增長,2015年以后語音芯片就開始陸續(xù)興起,包括聯(lián)發(fā)科MT8516、科勝訊CX20924、晶晨半導體A113、瑞芯微RK3036、北京君正X1000等公司,如聯(lián)發(fā)科推出了MT8516應用在了阿里天貓精靈上,晶晨A113應用在了小米AI音箱。

而以本次Rokid發(fā)布的AI語音專用SoC芯片KAMINO18為例,據(jù)官方稱,KAMINO18的成本相較于市場主流通用芯片降低了30%以上,兼顧了芯片性能和商用性。將ARM、NPU、DSPDDR、DAC等多個核心部件集成于KAMINO18中,最終產(chǎn)出與1元硬幣大小相當?shù)男酒=M。

同時,KAMINO18支持智能音箱和兒童故事機兩大產(chǎn)品領域,結(jié)合Rokid全新的相控陣技術、CTC模型、自定義喚醒詞、離線語音指令、低功耗喚醒等算法,搭載KAMINO18的產(chǎn)品整體功耗可降低30%至50%。

整體來說,這些語音芯片都是面向智能音箱以及智能家居場景打造的專用芯片,支持多通道麥克風陣列接口,采用適合做語音處理的CPU;在語音算法上支持回聲消除、噪聲抑制、聲源定位、語音增強等技術,并兼具運算能力和低功耗的考量。

爆發(fā)之態(tài) 智能語音的“未來三步”

為什么2018年會成為智能語音芯片的爆發(fā)期?這和智能音箱近兩年的爆發(fā)不無關系。市場分析公司Canalys預測,2018年全球智能音箱出貨量將超過5600萬臺。思必馳CMO龍夢竹亦指出,隨著智能音箱的爆發(fā),消費者對新型交互方式和新型智能硬件的認可、客戶對相關技術的認可都有一個很大的提升。

而除終端硬件的銷量增長之外,與場景的深度融合才是未來真正的考驗。聯(lián)發(fā)科副總經(jīng)理暨家庭娛樂產(chǎn)品事業(yè)群總經(jīng)理游人杰曾對智能語音的發(fā)展提出一個三階段論的觀點:他認為智能語音的第一階段是智能音箱的普及;第二階段是更多智能語音設備的出現(xiàn),語音成為人機交互的界面;第三階段就是端側(cè)智能,通過語音AI芯片來實現(xiàn)更多本地計算,提供用戶更好的交互體驗。

不難看出,目前還處于第一階段,需要推動智能音箱的普及以及更多智能設備的出現(xiàn),從而推動語音交互界面的到來。只有當語音成為一種交互界面,才意味著整個智能語音市場的爆發(fā),才會有更多的巨頭芯片廠商以及中小芯片商涌入其中,甚至誕生下一個芯片巨頭。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    87

    文章

    28877

    瀏覽量

    266225
  • 智能語音
    +關注

    關注

    10

    文章

    771

    瀏覽量

    48595

原文標題:【IC設計】AI語音芯片大作戰(zhàn) 誕生百億市場“獨角獸”

文章出處:【微信號:DIGITIMES,微信公眾號:DIGITIMES】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關推薦

    智能玩具用離線語音識別芯片有什么優(yōu)勢

    隨著科技的發(fā)展,很多智能電子產(chǎn)品和兒童玩具實現(xiàn)了與人類的交互,語音芯片在這些人機交互中起到了不可替代的作用,語音識別芯片在智能玩具中的應用就為其帶來了更多的
    的頭像 發(fā)表于 09-20 10:00 ?66次閱讀
    <b class='flag-5'>智能</b>玩具用離線<b class='flag-5'>語音</b>識別芯片有什么<b class='flag-5'>優(yōu)勢</b>

    Transformer模型在語音識別和語音生成中的應用優(yōu)勢

    自然語言處理、語音識別、語音生成等多個領域展現(xiàn)出強大的潛力和廣泛的應用前景。本文將從Transformer模型的基本原理出發(fā),深入探討其在語音識別和語音生成中的應用
    的頭像 發(fā)表于 07-03 18:24 ?730次閱讀

    簡單三步!高效預測半導體器件使用壽命

    電力電子元器件已經(jīng)成為現(xiàn)代電子系統(tǒng)中重要的組成部件,同時,元器件的熱性能將大大影響整體設備的可靠性。庭田科技提供的POWERTESTER測試平臺,在不破壞待測器件的前提下,僅需三步,即可高效安全
    的頭像 發(fā)表于 05-30 10:31 ?319次閱讀

    車內(nèi)語音識別技術:重塑智能駕駛的未來

    一、引言 隨著科技的飛速發(fā)展,智能駕駛已經(jīng)成為未來交通的必然趨勢。作為智能駕駛的關鍵技術之一,車內(nèi)語音識別技術正逐漸成為研究的熱點。它不僅提高了駕駛的便捷性和安全性,也為駕駛者提供了更
    的頭像 發(fā)表于 02-19 10:09 ?408次閱讀

    語音合成技術在智能駕駛中的應用與展望

    體驗。本文將探討語音合成技術在智能駕駛中的應用、優(yōu)勢以及未來發(fā)展趨勢。 二、語音合成技術在智能
    的頭像 發(fā)表于 02-01 17:50 ?403次閱讀

    智能語音助手在教育行業(yè)的應用與挑戰(zhàn)

    介紹語音數(shù)據(jù)集在教育智能語音助手中的應用、面臨的挑戰(zhàn)以及未來的發(fā)展趨勢。 二、語音數(shù)據(jù)集在教育智能
    的頭像 發(fā)表于 01-19 17:21 ?556次閱讀

    語音數(shù)據(jù)集在智能語音助手中的應用與挑戰(zhàn)

    。本文將詳細介紹語音數(shù)據(jù)集在智能語音助手中的應用、面臨的挑戰(zhàn)以及未來的發(fā)展趨勢。 二、語音數(shù)據(jù)集在智能
    的頭像 發(fā)表于 01-18 15:46 ?289次閱讀

    語音數(shù)據(jù)集在智能語音搜索中的應用與挑戰(zhàn)

    揮著重要作用,為系統(tǒng)提供了豐富的語音數(shù)據(jù)和信息,提高了搜索的準確性和效率。本文將詳細介紹語音數(shù)據(jù)集在智能語音搜索中的應用、面臨的挑戰(zhàn)以及未來
    的頭像 發(fā)表于 01-18 15:09 ?453次閱讀

    語音數(shù)據(jù)集在智能語音助手中的應用與挑戰(zhàn)

    語音合成模型。本文將詳細介紹語音數(shù)據(jù)集在智能語音助手中的應用、面臨的挑戰(zhàn)以及未來的發(fā)展趨勢。 二、語音
    的頭像 發(fā)表于 12-14 15:07 ?640次閱讀

    離線語音識別技術:掌控未來語音交互

    離線語音識別技術的核心優(yōu)勢在于其獨立性和實時性。在沒有網(wǎng)絡連接的情況下,設備依然能夠迅速識別用戶的語音指令,實現(xiàn)各種功能。這使得語音交互更加自然、流暢,讓用戶隨時隨地享受
    的頭像 發(fā)表于 12-13 11:12 ?464次閱讀
    離線<b class='flag-5'>語音</b>識別技術:掌控<b class='flag-5'>未來</b>的<b class='flag-5'>語音</b>交互

    情感語音識別技術的現(xiàn)狀與未來

    一、引言 情感語音識別技術是近年來人工智能領域的研究熱點之一,它通過分析人類語音中的情感信息,為智能客服、心理健康監(jiān)測、娛樂產(chǎn)業(yè)等多個領域提供了重要的支持。本文將探討情感
    的頭像 發(fā)表于 11-15 16:36 ?507次閱讀

    情感語音識別技術的應用與未來發(fā)展

    的應用、未來發(fā)展趨勢以及面臨的挑戰(zhàn)。 二、情感語音識別技術的應用 人機交互:情感語音識別技術在人機交互領域有著廣泛的應用。例如,智能客服可以通過分析用戶的
    的頭像 發(fā)表于 11-12 17:30 ?597次閱讀

    離線語音識別和控制的工作原理及應用

    。   、離線語音識別的優(yōu)勢和應用場景   離線語音識別具有數(shù)據(jù)安全性高、實時性好等優(yōu)點。此外,由于無需聯(lián)網(wǎng),離線語音識別在處理低延遲、高
    發(fā)表于 11-07 18:01

    KT148A語音芯片下載過程的問題集錦 包含下載不了批量生產(chǎn)的說明

    為什么我買的KT148A測試板-不能下載語音,驅(qū)動我也裝了,上面的三步我也詳細看了,感覺沒什么問題,出現(xiàn)這個問題會是什么原因呢?
    的頭像 發(fā)表于 10-14 11:50 ?368次閱讀
    KT148A<b class='flag-5'>語音</b>芯片下載過程的問題集錦 包含下載不了批量生產(chǎn)的說明

    語音識別技術:現(xiàn)狀、挑戰(zhàn)與未來發(fā)展

    一、引言 語音識別技術是一種將人類語音轉(zhuǎn)化為計算機可讀文本的技術,它在許多領域都有廣泛的應用,如智能助手、智能家居、醫(yī)療診斷等。本文將探討語音
    的頭像 發(fā)表于 10-12 16:57 ?1967次閱讀