0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀(guān)看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

“百箱大戰(zhàn)”時(shí)代開(kāi)啟,AI語(yǔ)音芯片熱度火到“互撕”?

電子工程師 ? 來(lái)源:lq ? 2019-01-06 11:28 ? 次閱讀

進(jìn)入 2019 年,AI技術(shù)的場(chǎng)景落地和商用化會(huì)成為一個(gè)更迫切的議題,但語(yǔ)音識(shí)別已是所有 AI 技術(shù)中最成功的領(lǐng)域,眼前有四大 AI 語(yǔ)音公司思必馳、云知聲、Rokid 、出門(mén)問(wèn)問(wèn)不約而同投入“造芯”運(yùn)動(dòng),開(kāi)始押寶自制 AI 語(yǔ)音芯片,開(kāi)啟第二戰(zhàn)場(chǎng)。

(來(lái)源:思必馳)

“融資”與“造芯”成為 AI 創(chuàng)業(yè)公司兩大主軸議題,思必馳在 2018 年完成 D 輪融資后,即透露與某芯片巨頭進(jìn)行 AI 芯片的研發(fā),如今答案揭曉,思必馳旗下的芯片設(shè)計(jì)公司“深聰”獲得“國(guó)家隊(duì)”中芯國(guó)際旗下的股權(quán)管理公司中芯聚源投資,同時(shí)中芯國(guó)際也為深聰打造第一顆 AI 語(yǔ)音芯片。

“百箱大戰(zhàn)”時(shí)代開(kāi)啟, AI 語(yǔ)音芯片熱度火到“互撕”?

基于深度學(xué)習(xí)(Deep Learning)的語(yǔ)音識(shí)別技術(shù)很快成為 AI 創(chuàng)業(yè)界的流量擔(dān)當(dāng),尤其 2017 年 Amazon 一口氣推出多款 Echo 系列產(chǎn)品,開(kāi)始了國(guó)內(nèi)“百箱大戰(zhàn)”的年代,更讓相關(guān) AI 語(yǔ)音企業(yè)迎來(lái)一陣小高潮,不少同性質(zhì)公司更是明爭(zhēng)暗斗陷入“互撕”局面,反映該市場(chǎng)的火熱程度。

根據(jù) Canalys 估計(jì),2017 年全球智能音箱出貨量突破 3000 萬(wàn)臺(tái),2018 年出貨量預(yù)計(jì)是超過(guò) 5600 萬(wàn)臺(tái),全球前四大品牌廠(chǎng)為 Google、Amazon、天貓、小米。再者,2017 年全球智能音箱用戶(hù)量排名前五名是美國(guó)、英國(guó)、德國(guó)、中國(guó)、加拿大,但 2018 年中國(guó)可望躍居第二名。

除了音箱之外,智能家居、汽車(chē)市場(chǎng)很多應(yīng)用場(chǎng)景的硬件也會(huì)陸續(xù)加入語(yǔ)音智能化的功能,讓 AI 語(yǔ)音技術(shù)的應(yīng)用場(chǎng)景增添無(wú)限想像空間。

光是 2018 年就有三家 AI 語(yǔ)音創(chuàng)業(yè)公司發(fā)表相關(guān)芯片,包括云知聲發(fā)表面向 AIoT 市場(chǎng)的 UniOne 芯片、出門(mén)問(wèn)問(wèn)的 AI 語(yǔ)音芯片模組“問(wèn)芯”Mobvoi A1、 Rokid 的 AI 語(yǔ)音芯片 KAMINO 18,思必馳透露要進(jìn)入自制芯片領(lǐng)域已有一段時(shí)間,4 日才正式對(duì)外揭露具體戰(zhàn)略細(xì)節(jié)。

中芯國(guó)際助陣,思必馳“造芯”如虎添翼

不同于云知聲、Rokid 進(jìn)入芯片自制領(lǐng)域,都是在公司內(nèi)部成立獨(dú)立部門(mén)進(jìn)行研發(fā),思必馳 2018 年初成立子公司“深聰”,2019 年初推出的第一顆產(chǎn)品是 AI 語(yǔ)音芯片深聰 TAIHANG 芯片。

(來(lái)源:思必馳)

思必馳扶植的深聰之所以引起業(yè)界注意,是因?yàn)樗急伛Y的“造芯”之路找來(lái)國(guó)內(nèi)半導(dǎo)體巨頭中芯國(guó)際助力,旗下的投資公司中芯聚源加入成為創(chuàng)始股東之一。再者,思必馳對(duì)深聰?shù)某止杀戎爻^(guò) 50%。

思必馳自制的首顆 AI 語(yǔ)音芯片,就是由中芯國(guó)際操刀,以 40 納米工藝打造,約莫是 2017 年中啟動(dòng)該芯片項(xiàng)目后,在 2018 年 8 月進(jìn)行流片,11 月芯片出來(lái)后,現(xiàn)在處于采集樣本階段,預(yù)計(jì) 2019 年中將進(jìn)入風(fēng)險(xiǎn)試產(chǎn),該顆芯片拔劍出鞘的速度十分快,幾乎把需要 6 個(gè)季度的工作,縮短為 3 個(gè)季度完成。

深聰 TAIHANG 芯片面向智能家居、智能終端、車(chē)載、手機(jī)、可穿戴設(shè)備等各類(lèi)終端設(shè)備,基于雙 DSP 架構(gòu),內(nèi)部集成 codec 編解碼器,以及大容量的內(nèi)置存儲(chǔ)單元,再者,該芯片也采用了指令集擴(kuò)展和算法硬件加速的手段,相較于傳統(tǒng)通用芯片具有 10X 以上的效率提升。

深聰聯(lián)合創(chuàng)始人吳耿源表示,在芯片戰(zhàn)略上是兩步走,因?yàn)楸澈髲?qiáng)大的需求力道驅(qū)動(dòng),第一顆芯片不單是求快,講求 time-to-market,也專(zhuān)注低功耗、單向反饋、實(shí)現(xiàn)算法加硬件融合優(yōu)化的想法。

同時(shí),深聰內(nèi)部已經(jīng)開(kāi)始第二顆芯片的規(guī)劃,是專(zhuān)用芯片加特定架購(gòu),雙向溝通更能達(dá)到軟硬件融合、深度優(yōu)化的功效提升,以軟件需求來(lái)定義芯片架構(gòu),再用架構(gòu)去反饋算法,同時(shí),算法也會(huì)優(yōu)化硬體架構(gòu),等于是彼此做到雙向溝通。預(yù)計(jì)該顆芯片將在 2019 年下半年流片,2020 年量產(chǎn)。

從“通用”到“專(zhuān)用”,這是一條怎么樣的心路歷程?

從通用芯片到量身打造專(zhuān)用芯片的過(guò)程,想必有一番思考、摸索與探尋,吳耿源接受 DT 君專(zhuān)訪(fǎng)時(shí)娓娓道來(lái)。

圖 | 深聰聯(lián)合創(chuàng)始人吳耿源(來(lái)源:思必馳)

吳耿源分析,思必馳是一家滿(mǎn)十歲的企業(yè),這幾年趕上 AI 崛起的浪潮,過(guò)去多年的技術(shù)積累獲得發(fā)力的機(jī)會(huì),目標(biāo)戰(zhàn)場(chǎng)是物聯(lián)網(wǎng),第一個(gè)應(yīng)用場(chǎng)景是智能音箱,一切有了很美好的揭幕,但坦白說(shuō),智能音箱終究“me too”產(chǎn)品,Amazon 已經(jīng)在前開(kāi)路。

思必馳的智能音箱初期用過(guò)很多家芯片大廠(chǎng)的通用芯片,但隨著產(chǎn)品線(xiàn)逐漸成長(zhǎng)茁壯后,許多問(wèn)題逐一浮現(xiàn) 。畢竟,通用芯片功能再怎么強(qiáng)大,落地到 AI 場(chǎng)景上會(huì)有削足適履之感,加上很多目標(biāo)市場(chǎng)越來(lái)越明確、消費(fèi)者群聚效應(yīng)展現(xiàn)后,特制化芯片的需求因此誕生 。

AI 芯片在市場(chǎng)上有兩路的提供者,早幾年都是通用芯片的天下,像是高通、聯(lián)發(fā)科等,這些巨頭在芯片戰(zhàn)略上,較為著眼于商業(yè)利益價(jià)值,但是,很多 AI 應(yīng)用場(chǎng)景都屬于細(xì)分賽道,要通用芯片巨頭“削足適履”,會(huì)比較不切實(shí)際。

這些芯片巨頭當(dāng)然也會(huì)想要“染指”AI 市場(chǎng),但這個(gè)市場(chǎng)和他們過(guò)去擅長(zhǎng)的游戲規(guī)則有落差,以前是巨頭們?cè)O(shè)計(jì)出什么樣的芯片,客戶(hù)就要乖乖接受,但 AI 市場(chǎng)是反其道而行,要透過(guò)使用者來(lái)定義產(chǎn)品,再由把需求反饋給算法,靠算法實(shí)現(xiàn) 。

但是,傳統(tǒng)芯片巨頭無(wú)法緊密地直接觸碰市場(chǎng)需求,或是內(nèi)部沒(méi)有強(qiáng)大的算法團(tuán)隊(duì)或數(shù)據(jù)(Data)做后援,在 AI 領(lǐng)域要成功,算法、數(shù)據(jù)、正確地定義市場(chǎng)都是關(guān)鍵。

因此,近幾年起算法公司開(kāi)始切入“造芯”運(yùn)動(dòng),也提供給算法公司實(shí)現(xiàn)垂直整合布局的機(jī)會(huì),更重要的是,通過(guò)“造芯”來(lái)確保產(chǎn)品的差異化和核心價(jià)值凸顯出來(lái)。

吳耿源表示,思必馳從算法公司跨入產(chǎn)品,再垂直整合成一個(gè)平臺(tái),上下串連系統(tǒng),在云端(Cloud)、邊緣(Edge)兩端都有布局,關(guān)鍵就是欠缺一個(gè)硬件芯片去擔(dān)任執(zhí)行的角色,而 AI 領(lǐng)域是軟件定義芯片,初期用市面上通用芯片時(shí),也發(fā)現(xiàn)算法與芯片對(duì)接的過(guò)程,有很多文化融合的問(wèn)題。

舉個(gè)例子,當(dāng)算法遇到芯片,發(fā)生的第一個(gè)沖突是算法的改朝換代速度遠(yuǎn)快于芯片的工藝技術(shù)。

一般而言,從定義產(chǎn)品到芯片誕生于世,大概要“懷胎”兩年(24 個(gè)月),中間經(jīng)歷設(shè)計(jì)、流片、試產(chǎn)、改版、升級(jí)、量產(chǎn),每一個(gè)階段慢慢磨練,中間經(jīng)歷的循環(huán)以“季度”為單位來(lái)計(jì)算。

反觀(guān)在算法的世界里,每周都在改,循環(huán)可能是以“周”作為單位,若將算法與芯片擺在同一家企業(yè)中,彼此步伐不一致的問(wèn)題會(huì)產(chǎn)生明顯的內(nèi)部矛盾與沖突。

思必馳從算法、產(chǎn)品、平臺(tái)、系統(tǒng)整合布局到整個(gè)生態(tài)系統(tǒng),現(xiàn)在加入深聰自制 AI 語(yǔ)音芯片,布局齊全后,將跨出智能音箱這個(gè)“me too”市場(chǎng),進(jìn)入AIoT領(lǐng)域,包括 TV 盒子、白色家電、智慧家庭、故事機(jī)等。當(dāng)物聯(lián)網(wǎng)遇上 AI,商機(jī)無(wú)可限量。

多模式人機(jī)交互是理想桃花源

吳耿源進(jìn)一步指出,光是語(yǔ)音 AI 技術(shù)就還有很大的精進(jìn)空間,現(xiàn)在的智能音箱的溝通仍需經(jīng)過(guò)“喚醒”的程序,其實(shí)是“人工弱智”,要做到自然人機(jī)交互,當(dāng)中的技術(shù)突破就需要算法的大幅增進(jìn),其中一個(gè)關(guān)鍵的元素是聲紋。

市面上的智能音箱只能識(shí)別出說(shuō)話(huà)的內(nèi)容,再針對(duì)問(wèn)題給出反饋信息,這樣的交互方式是智能化的,但交流方式卻不夠聰明,因?yàn)楸仨氁诿鞔_對(duì)象的情況下進(jìn)行,唯有做到“聞聲即可識(shí)人”,不需要“喚醒”這個(gè)多余的動(dòng)作,這才是真正的 “ SMART ” 。

吳耿源進(jìn)一步解釋?zhuān)珹I 語(yǔ)音芯片在應(yīng)用場(chǎng)景的廣度上,絕對(duì)不單是音箱領(lǐng)域,還包括物聯(lián)網(wǎng)、智慧家庭、車(chē)載市場(chǎng)等,更進(jìn)一步場(chǎng)景是多模生態(tài),當(dāng)下 AI 是最好的時(shí)代,天時(shí)、地利、人和,AI 時(shí)代正在騰飛、國(guó)家關(guān)注造芯、加上軟件、硬件、人和的融合。

現(xiàn)在的 AI 技術(shù)場(chǎng)景分別在語(yǔ)音、視覺(jué)兩大領(lǐng)域有不錯(cuò)的起步和成功的場(chǎng)景落地,但卻都是各自表現(xiàn),所謂的多模生態(tài)是指聲覺(jué)、視覺(jué)、五官、手勢(shì)、觸摸等獨(dú)立的功能融合在一起,實(shí)現(xiàn)自然的多模式人機(jī)交互。

AI 技術(shù)領(lǐng)域的前方是無(wú)人區(qū),只能摸著石頭過(guò)河,每一步都是挑戰(zhàn),但也處處是驚喜。

更重要的是,這是一個(gè)國(guó)內(nèi)最有機(jī)會(huì)與美國(guó)科技先驅(qū)并行的領(lǐng)域,AI 技術(shù)的“ 造芯 ”運(yùn)動(dòng)是日正當(dāng)中,想想海思追趕高通也花了超過(guò)十年,才造就今日的江湖地位,國(guó)內(nèi)發(fā)展 AI 技術(shù)有應(yīng)用場(chǎng)景做后盾,要打造出一家巨星級(jí)的企業(yè),這一劍肯定不用磨到十年!

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀(guān)點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 語(yǔ)音芯片
    +關(guān)注

    關(guān)注

    12

    文章

    1678

    瀏覽量

    36211
  • ai技術(shù)
    +關(guān)注

    關(guān)注

    1

    文章

    1243

    瀏覽量

    24003

原文標(biāo)題:中國(guó)4大AI語(yǔ)音公司掀起“造芯運(yùn)動(dòng)”:國(guó)家隊(duì)中芯國(guó)際正式入場(chǎng),行業(yè)洗牌在即

文章出處:【微信號(hào):deeptechchina,微信公眾號(hào):deeptechchina】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    啟英泰倫CI13LC系列:打造AI語(yǔ)音芯片性?xún)r(jià)比之王!

    語(yǔ)音部分應(yīng)用領(lǐng)域CI13XX系列:高性能AI語(yǔ)音芯片領(lǐng)航者2021年,啟英泰倫推出了3代高性能AI語(yǔ)音
    的頭像 發(fā)表于 07-12 08:15 ?245次閱讀
    啟英泰倫CI13LC系列:打造<b class='flag-5'>AI</b><b class='flag-5'>語(yǔ)音</b><b class='flag-5'>芯片</b>性?xún)r(jià)比之王!

    華為汪濤:5G-A商用元年和AI入端元年碰撞,將開(kāi)啟“移動(dòng)AI時(shí)代

    [中國(guó),上海,2024年6月26日] 2024 MWC上海期間,華為常務(wù)董事、ICT基礎(chǔ)設(shè)施業(yè)務(wù)管理委員會(huì)主任汪濤在大會(huì)上發(fā)表了“加速5G-A發(fā)展,開(kāi)啟移動(dòng)AI時(shí)代”的主題演講。他表示,2024年
    的頭像 發(fā)表于 06-27 17:28 ?1100次閱讀

    聆思CSK6視覺(jué)語(yǔ)音大模型AI開(kāi)發(fā)板入門(mén)資源合集(硬件資料、大模型語(yǔ)音/多模態(tài)交互/英語(yǔ)評(píng)測(cè)SDK合集)

    本帖最后由 jf_40317719 于 2024-6-18 17:39 編輯 視覺(jué)語(yǔ)音大模型 AI 開(kāi)發(fā)套件( CSK6-MIX )是圍繞 CSK6011A 芯片設(shè)計(jì)的具備豐富語(yǔ)音
    發(fā)表于 06-18 17:33

    AI芯片哪里買(mǎi)?

    AI芯片
    芯廣場(chǎng)
    發(fā)布于 :2024年05月31日 16:58:19

    李未可科技發(fā)布全新首款AI眼鏡Chat,搭載自研AI大模型

    AI語(yǔ)音助手,為用戶(hù)開(kāi)啟超擬人的AI語(yǔ)音交互新體驗(yàn)。用戶(hù)可使用語(yǔ)音交互讓
    發(fā)表于 04-26 10:45 ?1407次閱讀
    李未可科技發(fā)布全新首款<b class='flag-5'>AI</b>眼鏡Chat,搭載自研<b class='flag-5'>AI</b>大模型

    寧暢發(fā)布“全局智算”,大模型花齊放時(shí)代,為AI計(jì)算開(kāi)啟新篇

    AI行業(yè)芯事
    腦極體
    發(fā)布于 :2024年04月02日 21:22:36

    大戰(zhàn)”競(jìng)爭(zhēng)格局報(bào)告發(fā)布,云天天書(shū)大模型入選典型案例

    3月24日,在2024全球開(kāi)發(fā)者大會(huì)“大戰(zhàn)”商業(yè)發(fā)展講壇上,億歐智庫(kù)正式發(fā)布《2024中國(guó)“大戰(zhàn)”競(jìng)爭(zhēng)格局分析報(bào)告》,從當(dāng)前行業(yè)“
    的頭像 發(fā)表于 03-26 14:01 ?392次閱讀
    “<b class='flag-5'>百</b>模<b class='flag-5'>大戰(zhàn)</b>”競(jìng)爭(zhēng)格局報(bào)告發(fā)布,云天天書(shū)大模型入選典型案例

    【有獎(jiǎng)】 度智能云度目推出首款多模態(tài) AI 模組,應(yīng)用場(chǎng)景有獎(jiǎng)?wù)骷?/a>

    他來(lái)了,他來(lái)了 大模型時(shí)代悄然到來(lái) 度首款大模型落地的硬件產(chǎn)品 度目多模態(tài)AI模組LUCA系列正式亮相 度目LUCA深度集成語(yǔ)音
    的頭像 發(fā)表于 02-26 15:19 ?456次閱讀

    AI語(yǔ)音與機(jī)器視覺(jué)開(kāi)發(fā)應(yīng)用系統(tǒng)

    一、簡(jiǎn)介 AI語(yǔ)音與機(jī)器視覺(jué)開(kāi)發(fā)應(yīng)用系統(tǒng)是一款集成AI語(yǔ)音、機(jī)器視覺(jué)、深度學(xué)習(xí)基礎(chǔ)、嵌入式Linux于一體的高端教學(xué)科研實(shí)驗(yàn)平臺(tái)。 整個(gè)教學(xué)平臺(tái)由實(shí)驗(yàn)
    的頭像 發(fā)表于 01-26 11:24 ?284次閱讀
    <b class='flag-5'>AI</b><b class='flag-5'>語(yǔ)音</b>與機(jī)器視覺(jué)開(kāi)發(fā)應(yīng)用系統(tǒng)

    讓設(shè)備更聰明 |離線(xiàn)自然說(shuō),開(kāi)啟智能語(yǔ)音交互新體驗(yàn)!

    離線(xiàn)語(yǔ)音識(shí)別是指不需要依賴(lài)網(wǎng)絡(luò),在本地設(shè)備實(shí)現(xiàn)語(yǔ)音識(shí)別的過(guò)程,通常以端側(cè)AI語(yǔ)音芯片作為載體來(lái)進(jìn)行數(shù)據(jù)的采集、計(jì)算和決策。但是
    的頭像 發(fā)表于 01-10 08:15 ?768次閱讀
    讓設(shè)備更聰明 |離線(xiàn)自然說(shuō),<b class='flag-5'>開(kāi)啟</b>智能<b class='flag-5'>語(yǔ)音</b>交互新體驗(yàn)!

    在線(xiàn)研討會(huì) | 大模型時(shí)代語(yǔ)音 AI 模型的訓(xùn)練、優(yōu)化與應(yīng)用

    通過(guò)業(yè)界領(lǐng)先的技術(shù),幫助企業(yè)能夠快速部署定制化 AI 智能語(yǔ)音端流程。 2023 年 12 月 19 日和 21 日 晚間 ,來(lái)自 NVIDIA 和 Kaldi 項(xiàng)目的技術(shù)專(zhuān)家將做客 Datafun 社區(qū)直播間 ,為您介紹如
    的頭像 發(fā)表于 12-15 15:50 ?491次閱讀
    在線(xiàn)研討會(huì) | 大模型<b class='flag-5'>時(shí)代</b><b class='flag-5'>語(yǔ)音</b> <b class='flag-5'>AI</b> 模型的訓(xùn)練、優(yōu)化與應(yīng)用

    語(yǔ)音數(shù)據(jù)集:AI語(yǔ)音技術(shù)的靈魂

    一、引言 在人工智能領(lǐng)域,語(yǔ)音技術(shù)被譽(yù)為“未來(lái)人機(jī)交互的入口”,而語(yǔ)音數(shù)據(jù)集則是AI語(yǔ)音技術(shù)的靈魂。本文將深入探討語(yǔ)音數(shù)據(jù)集的重要性、構(gòu)建方
    的頭像 發(fā)表于 12-14 14:33 ?822次閱讀

    異構(gòu)專(zhuān)用AI芯片的黃金時(shí)代

    異構(gòu)專(zhuān)用AI芯片的黃金時(shí)代
    的頭像 發(fā)表于 12-04 16:42 ?499次閱讀
    異構(gòu)專(zhuān)用<b class='flag-5'>AI</b><b class='flag-5'>芯片</b>的黃金<b class='flag-5'>時(shí)代</b>

    OpenAI“政變”進(jìn)行時(shí),“大戰(zhàn)”接下來(lái)該戰(zhàn)什么?

    大戰(zhàn)”,不同賽道都在戰(zhàn)什么?
    的頭像 發(fā)表于 11-21 18:20 ?882次閱讀
    OpenAI“政變”進(jìn)行時(shí),“<b class='flag-5'>百</b>模<b class='flag-5'>大戰(zhàn)</b>”接下來(lái)該戰(zhàn)什么?

    低成本語(yǔ)音芯片是如何寫(xiě)入語(yǔ)音芯片里面otp和flash型

    低成本語(yǔ)音芯片是如何寫(xiě)入語(yǔ)音芯片里面otp和flash型。低成本其實(shí)是一個(gè)相對(duì)的概念,比如:玩具類(lèi)型的巨量產(chǎn)品,簡(jiǎn)單,它的低成本就是最低,
    的頭像 發(fā)表于 11-01 14:08 ?507次閱讀
    低成本<b class='flag-5'>語(yǔ)音</b><b class='flag-5'>芯片</b>是如何寫(xiě)入<b class='flag-5'>語(yǔ)音</b><b class='flag-5'>到</b><b class='flag-5'>芯片</b>里面otp和flash型