進(jìn)入 2019 年, AI 技術(shù)的場景落地和商用化會(huì)成為一個(gè)更迫切的議題,但語音識(shí)別已是所有 AI 技術(shù)中最成功的領(lǐng)域,眼前有四大AI語音公司思必馳、云知聲、Rokid 、出門問問不約而同投入“造芯”運(yùn)動(dòng),開始押寶自制 AI 語音芯片,開啟第二戰(zhàn)場!
“融資”與“造芯”成為 AI 創(chuàng)業(yè)公司兩大主軸議題,思必馳在 2018 年完成 D 輪融資后,即透露與某芯片巨頭進(jìn)行 AI 芯片的研發(fā),如今答案揭曉,思必馳旗下的芯片設(shè)計(jì)公司“深聰”獲得“國家隊(duì)”中芯國際旗下的股權(quán)管理公司中芯聚源投資,同時(shí)中芯國際也為深聰打造第一顆 AI 語音芯片。
“百箱大戰(zhàn)”時(shí)代開啟 ,AI 語音芯片熱度火到“互撕”?
基于深度學(xué)習(xí)( Deep Learning )的語音辨識(shí)技術(shù)很快成為 AI 創(chuàng)業(yè)界的流量擔(dān)當(dāng),尤其 2017 年 Amazon 一口氣推出多款Echo系列產(chǎn)品,開始了國內(nèi)“百箱大戰(zhàn)”的年代,更讓相關(guān) AI 語音企業(yè)迎來一陣小高潮,不少同性質(zhì)公司更是明爭暗斗陷入“互撕”局面,反應(yīng)該市場的火熱程度。
根據(jù) Canalys 估計(jì), 2017 年全球智能音箱出貨量突破 3000 萬臺(tái), 2018 年出貨量預(yù)計(jì)是超過 5600 萬臺(tái),全球前四大品牌廠為Google、Amazon、天貓、小米。再者, 2017 年全球智能音箱用戶量排名前五名是美國、英國、德國、中國、加拿大,但2018年中國可望躍居第二名。
除了音箱之外,智能家居、汽車市場很多應(yīng)用場景的硬件也會(huì)陸續(xù)加入語音智能化的功能,都讓 AI 語音技術(shù)的應(yīng)用場景增添無限想像空間。
光是 2018 年就有三家 AI 語音創(chuàng)業(yè)公司發(fā)表相關(guān)芯片,包括云知聲發(fā)表面向 AIoT 市場的 UniOne 芯片、出門問問的 AI 語音芯片模組“問芯”Mobvoi A1、 Rokid 的 AI 語音芯片 KAMINO 18 ,思必馳透露要進(jìn)入自制芯片領(lǐng)域已有一段時(shí)間,4日才正式對(duì)外揭露具體戰(zhàn)略細(xì)節(jié)。
中芯國際助陣,思必馳“造芯”如虎添翼
不同于云知聲、Rokid進(jìn)入芯片自制領(lǐng)域,都是在公司內(nèi)部成立獨(dú)立部門進(jìn)行研發(fā),思必馳2018年初成立子公司“深聰”,2019年初推出的第一顆產(chǎn)品是AI語音芯片深聰TAIHANG芯片。
思必馳扶植的深聰之所以引起業(yè)界注意,是因?yàn)樗急伛Y的“造芯”之路,找來國內(nèi)半導(dǎo)體巨頭中芯國際助力,旗下的投資公司中芯聚源加入成為創(chuàng)始股東之一。再者,思必馳對(duì)深聰?shù)某止杀戎爻^50%。
思必馳自制的首顆AI語音芯片,就是由中芯國際操刀,以40納米工藝打造,約莫是2017年中啟動(dòng)該芯片項(xiàng)目后,在2018年8月進(jìn)行流片,11月芯片出來后,現(xiàn)在處于采集樣本階段,預(yù)計(jì)2019年中將進(jìn)入風(fēng)險(xiǎn)試產(chǎn),該顆芯片拔劍出鞘的速度十分快,幾乎把需要6 個(gè)季度的工作,縮短為3個(gè)季度完成。
深聰TAIHANG芯片面向智能家居、智能終端、車載、手機(jī)、可穿戴設(shè)備等各類終端設(shè)備,基于雙DSP架構(gòu),內(nèi)部集成codec編解碼器,以及大容量的內(nèi)置存儲(chǔ)單元,再者,該芯片也采用了指令集擴(kuò)展和算法硬件加速的手段,相較于傳統(tǒng)通用芯片具有10X以上的效率提升。
深聰聯(lián)合創(chuàng)始人吳耿源表示,在芯片戰(zhàn)略上是兩步走,因?yàn)楸澈髲?qiáng)大的需求力道驅(qū)動(dòng),第一顆芯片不單是求快,講求time-to-market,也專注低功耗、單向反愧實(shí)現(xiàn)算法加硬件融合優(yōu)化的想法。
同時(shí),深聰內(nèi)部已經(jīng)開始第二顆芯片的規(guī)劃,是專用芯片加特定架購,雙向溝通更能達(dá)到軟硬件融合、深度優(yōu)化的功效提升,以軟件需求來定義芯片架構(gòu),再用架構(gòu)去反饋算法,同時(shí),算法也會(huì)優(yōu)化硬體架構(gòu),等于是彼此做到雙向溝通,預(yù)計(jì)該顆芯片將在2019年下半年流片,2020年量產(chǎn)。
從“通用”到“專用”,這是一條怎么樣的心路歷程?
從通用芯片到量身打造專用芯片的過程,想必有一番思考、摸索與探尋,吳耿源接受DT君專訪時(shí)娓娓道來。
吳耿源分析,思必馳是一家滿十歲的企業(yè),這幾年趕上AI崛起的浪潮,過去多年的技術(shù)積累獲得發(fā)力的機(jī)會(huì),目標(biāo)戰(zhàn)場是物聯(lián)網(wǎng),第一個(gè)應(yīng)用場景是智能音箱,一切有了很美好的揭幕,但坦白說,智能音箱終究“ me too ”產(chǎn)品,Amazon 已經(jīng)在前開路。
思必馳的智能音箱初期用過很多家芯片大廠的通用芯片,但隨著產(chǎn)品線逐漸成長茁壯后,許多問題逐一浮現(xiàn)。因?yàn)椋ㄓ眯酒δ茉僭趺磸?qiáng)大,落地到AI場景上會(huì)有削足適履之感,加上很多目標(biāo)市場越來越明確、消費(fèi)者群聚效應(yīng)展現(xiàn)后,特制化芯片的需求因此誕生。
AI 芯片在市場上有兩路的提供者,早幾年都是通用芯片的天下,像是高通、聯(lián)發(fā)科等,這些巨頭在芯片戰(zhàn)略上,較為著眼于商業(yè)利益價(jià)值,但是,很多AI應(yīng)用場景都屬于細(xì)分賽道,要通用芯片巨頭“削足適履”,會(huì)比較不切實(shí)際。
這些芯片巨頭當(dāng)然也會(huì)想要“染指”AI市場,但這個(gè)市場和他們過去擅長的游戲規(guī)則有落差,以前是巨頭們設(shè)計(jì)出什么樣的芯片,客戶就要乖乖接受,但AI市場是反其道而行,要透過使用者來定義產(chǎn)品,再由把需求反饋給算法,靠算法實(shí)現(xiàn)。
但是,傳統(tǒng)芯片巨頭無法緊密地直接觸碰市場需求,或是內(nèi)部沒有強(qiáng)大的算法團(tuán)隊(duì)或數(shù)據(jù)(Data)做后援,在AI領(lǐng)域要成功,算法、數(shù)據(jù)、正確地定義市場都是關(guān)鍵。
因此,近幾年起算法公司開始切入“造芯”運(yùn)動(dòng),也提供給算法公司實(shí)現(xiàn)垂直整合布局的機(jī)會(huì),更重要的是,借由“造芯”來確保產(chǎn)品的差異化和核心價(jià)值凸顯出來。
吳耿源表示,思必馳從算法公司跨入產(chǎn)品,再垂直整合成一個(gè)平臺(tái),上下串連系統(tǒng),在云端(Cloud)、邊緣(Edge)兩端都有布局,關(guān)鍵就是欠缺一個(gè)硬件芯片去擔(dān)任執(zhí)行的角色,而AI領(lǐng)域是軟件定義芯片,初期用市面上通用芯片時(shí),也發(fā)現(xiàn)算法與芯片對(duì)接的過程,有很多文化融合的問題。
舉個(gè)例子,當(dāng)算法遇到芯片,發(fā)生的第一個(gè)沖突是算法的改朝換代速度遠(yuǎn)快于芯片的工藝技術(shù)。
一般而言,從定義產(chǎn)品到芯片誕生于世,大概要“懷胎”兩年(24個(gè)月),中間經(jīng)歷設(shè)計(jì)、流片、試產(chǎn)、改版、升級(jí)、量產(chǎn),每一個(gè)階段慢慢磨練,中間經(jīng)歷的循環(huán)以“季度”為單位來計(jì)算。
反觀在算法的世界里,每一個(gè)禮拜都在改,循環(huán)可能是以“禮拜”作為單位,若將算法與芯片擺在同一家企業(yè)中,彼此步伐不一致的問題,會(huì)產(chǎn)生明顯的內(nèi)部矛盾與沖突。
思必馳從算法、產(chǎn)品、平臺(tái)、系統(tǒng)整合布局到整個(gè)生態(tài)系統(tǒng),現(xiàn)在加入深聰自制AI語音芯片,布局齊全后,將跨出智能音箱這個(gè)“me too”市場,進(jìn)入AIoT領(lǐng)域,包括TV盒子、白色家電、智慧家庭、故事機(jī)等,當(dāng)物聯(lián)網(wǎng)遇上AI,商機(jī)是無可限量。
多模式人機(jī)交互是理想桃花源
吳耿源進(jìn)一步指出,光是語音AI技術(shù)就還有很大的精進(jìn)空間,現(xiàn)在的智能音箱的溝通仍需經(jīng)過“喚醒”的程序,其實(shí)是“人工弱智”,要做到自然人機(jī)交互,當(dāng)中的技術(shù)突破就需要算法的大幅增進(jìn),其中一個(gè)關(guān)鍵的元素是聲紋。
市面上的智能音箱只能辨識(shí)出說話的內(nèi)容,再針對(duì)問題給出反饋信息,這樣的交互方式是智能化的,但交流方式卻不夠聰明,因?yàn)楸仨氁诿鞔_對(duì)象的情況下進(jìn)行,唯有做到“聞聲即可識(shí)人”,不需要“喚醒”這個(gè)多余的動(dòng)作,這才是真正的“SMART”。
吳耿源進(jìn)一步解釋,AI語音芯片在應(yīng)用場景的廣度上,絕對(duì)不單是音箱領(lǐng)域,還包括物聯(lián)網(wǎng)、智慧家庭、車載市場等,更進(jìn)一步場景是多模生態(tài),當(dāng)下AI是最好的時(shí)代,天時(shí)、地利、人和,AI時(shí)代正在騰飛、國家關(guān)注造芯、加上軟件、硬件、人和的融合。
現(xiàn)在的AI技術(shù)場景分別在語音、視覺兩大領(lǐng)域有不錯(cuò)的起步和成功的場景落地,但卻都是各自表現(xiàn),所謂的多模生態(tài)是指聲覺、視覺、五官、手勢、觸摸等獨(dú)立的功能融合在一起,實(shí)現(xiàn)自然的多模式人機(jī)交互。
AI技術(shù)領(lǐng)域的前方是無人區(qū),只能摸著石頭過河,每一步都是挑戰(zhàn),但也處處是驚喜。
更重要的是,這是一個(gè)國內(nèi)最有機(jī)會(huì)與美國科技先驅(qū)并行的領(lǐng)域,AI技術(shù)的“造芯”運(yùn)動(dòng)是日正當(dāng)中,想想海思追趕高通也花了超過十年,才造就今日的江湖地位,國內(nèi)發(fā)展AI技術(shù)有應(yīng)用場景做后盾,要打造出一家巨星級(jí)的企業(yè),這一劍肯定不用磨到十年!
評(píng)論
查看更多