在今年的國(guó)際消費(fèi)電子展(CES 2018)上,語(yǔ)音(voice)、連接(connectivity)和人工智能(AI)成為最受關(guān)注的焦點(diǎn)。如果說今年的CES能為我們帶來什么指標(biāo),那么這三項(xiàng)建構(gòu)模塊將是組成2018年及未來消費(fèi)電子設(shè)備缺一不可的神圣“三位一體”。
語(yǔ)音助理已經(jīng)準(zhǔn)備好進(jìn)入可穿戴設(shè)備、耳機(jī)、嬰兒監(jiān)視器、燈具、電視遙控器和車輛。DSP Concepts創(chuàng)辦人兼首席技術(shù)官Paul Beckmann在接受《EE Times》時(shí)說:“我們似乎正見證著一場(chǎng)圍繞著語(yǔ)音的‘寒武紀(jì)大爆發(fā)’?!?br />
DSP Concepts首席技術(shù)官Paul Beckmann
在CES上,被稱為“中國(guó)Google”的百度大力向開發(fā)商展示并開放其基于Duer OS的平臺(tái)。無(wú)論是其聲控臺(tái)燈或掛在天花板上的投影機(jī)和屏幕,都不需要Alexa或Google Assist。就像百度常掛在嘴邊的“中國(guó)速度”,越來越多的廠商開始朝向語(yǔ)音發(fā)展。
百度展示了一款整合臺(tái)燈功能的聲控智能喇叭(來源:Baidu)
消費(fèi)設(shè)備必須具備連接能力已經(jīng)是不爭(zhēng)的事實(shí)。Silicon Labs首席執(zhí)行官Tyson Tuttle強(qiáng)調(diào),接下來的必備功能是“混搭”不同的無(wú)線網(wǎng)絡(luò)。他解釋說,直接將原本為智能手機(jī)設(shè)計(jì)的連接芯片加進(jìn)物聯(lián)網(wǎng)(IoT)設(shè)備,已經(jīng)無(wú)法滿足要求了。系統(tǒng)需要?jiǎng)討B(tài)的多協(xié)議軟件,以及為不同的無(wú)線網(wǎng)絡(luò)劃分時(shí)間的能力。
盡管AI在高度自動(dòng)化汽車中占據(jù)主導(dǎo)地位,但Ceva首席執(zhí)行官Gideon Wertheizer告訴我們:“我看到AI開始擺脫幻想世界?!惫?yīng)商如今正試著“設(shè)置參數(shù),在隨機(jī)環(huán)境中使用AI來解決特定問題?!?br /> Ceva首席執(zhí)行官Gideon Wertheizer
換句話說,許多公司開始學(xué)習(xí)在小規(guī)模應(yīng)用中導(dǎo)入AI,并將其用于特定任務(wù),而非依靠AI來解決世界上的問題。
語(yǔ)音隨車上路
無(wú)論是在家庭或開車行駛中,語(yǔ)音都將至關(guān)重要。
博世(Robert Bosch)在CES宣布計(jì)劃將其語(yǔ)音助理設(shè)計(jì)在方向盤后方。博世管理董事會(huì)成員Dirk Hoheisel表示:“我們正致力于讓駕駛艙內(nèi)的按鈕亂象劃下句點(diǎn)。”Elektrobit在CES上承諾,該公司將成為亞馬遜(Amazon) Alexa的第一批汽車軟件整合商之一。
Bosch開發(fā)“自然語(yǔ)言”車內(nèi)語(yǔ)音輔助系統(tǒng)(來源:Bosch)
百度宣布其基于Duer OS的Apollo 2.0平臺(tái)被稱為“自動(dòng)車輛的Android”,并稱語(yǔ)音輔助系統(tǒng)將成為該平臺(tái)的一部份。百度總裁兼COO陸奇表示:“家庭與車輛之間已經(jīng)不存在界限了。無(wú)論你在家中做什么,應(yīng)該也都可以在車子里實(shí)現(xiàn)?!?/p>
Wertheizer則指出,無(wú)論是在家中還是車內(nèi),隔離聲音以及直接向云端發(fā)送清晰的訊號(hào)都非常困難。 “我們的周遭充斥著噪音和噪聲著。”很自然地,家庭和汽車的解決方案必須能夠因應(yīng)一連串完全不同的嘈雜環(huán)境。
語(yǔ)音算法缺少標(biāo)準(zhǔn)
讓問題變得更復(fù)雜的原因在于業(yè)界還沒有任何標(biāo)準(zhǔn)的語(yǔ)音算法。
Wertheizer表示:“每一家公司都有自家處理語(yǔ)音的專有算法?!?/p>
系統(tǒng)業(yè)者開始求助于學(xué)術(shù)界發(fā)表的技術(shù)論文,競(jìng)相找出如何最有效隔離語(yǔ)音的解決之道。而當(dāng)他們使用不同的麥克風(fēng)和揚(yáng)聲器類型時(shí),還必須優(yōu)化其算法,以因應(yīng)不同的設(shè)置要求。
而在Ceva,Wertheizer說:“我們必須建立一個(gè)類似原子庇護(hù)所的工作室”,用于研究所有的選擇,并開發(fā)波束成形、遠(yuǎn)場(chǎng)和近場(chǎng)、回聲消除和環(huán)境降噪等算法。
Beckman也呼應(yīng)了這個(gè)觀點(diǎn)。就像人們喜歡語(yǔ)音作為自然的用戶接口一樣,他說:“遺憾的是,對(duì)于實(shí)際執(zhí)行的產(chǎn)品設(shè)計(jì)人員來說,它是最具挑戰(zhàn)的技術(shù)之一?!彼呀?jīng)看到了太多的語(yǔ)音項(xiàng)目出錯(cuò)了,最終得回到草圖階段重新開始。
Beckman曾經(jīng)在Bose Corp.擔(dān)任研究工程師長(zhǎng)達(dá)9年,在2000年初成立了他的咨詢業(yè)務(wù)。當(dāng)他與客戶討論語(yǔ)音項(xiàng)目時(shí),他發(fā)現(xiàn)業(yè)界需要一套有效執(zhí)行的“完整軟件解決方案,以及能為其實(shí)現(xiàn)差異化的底層技術(shù)”。但是,最主要的關(guān)鍵在于賦予其能夠自行調(diào)整系統(tǒng)的能力。
隨著語(yǔ)音市場(chǎng)爆發(fā),Beckman的業(yè)務(wù)也隨之成長(zhǎng)。DSP Concepts不再只是一家咨詢公司,現(xiàn)在還提供了一套完整的算法作為軟件庫(kù)和除錯(cuò)工具,有助于客戶調(diào)整系統(tǒng)。Beckman說:“我們提供調(diào)整、整合和驗(yàn)證工具?!?br />
語(yǔ)音UI解決方案需要一套完整的算法(來源:DSP Concepts)
DSP Concepts的語(yǔ)音用戶接口(UI)技術(shù)稱為Audio Weaver,它是第一家獲得亞馬遜(Amazon) Alexa產(chǎn)品認(rèn)證的第三方軟件公司。DSP Concepts共同創(chuàng)辦人兼首席執(zhí)行官Chin Beckmann展示一款A(yù)udio Weaver語(yǔ)音助理產(chǎn)品——相較于亞馬遜Echo使用了7支麥克風(fēng),Audio Weaver僅用了2支麥克風(fēng),據(jù)稱就能夠“聽”得比Echo或Google Home更清楚。
在邊緣實(shí)現(xiàn)AI
Wertheizer說,隔離語(yǔ)音是第一步,但接下來還有其他步驟:語(yǔ)音助理必須辨識(shí)語(yǔ)音的位置,而且必須能夠追蹤語(yǔ)音。而且,它必須能偵測(cè)以及辨識(shí)誰(shuí)在房間里說話。
直到最近,云端才剛被認(rèn)為是處理和學(xué)習(xí)的地方。如今,這個(gè)假設(shè)將在2018年發(fā)生改變。
Wertheizer解釋說:“我看到人們對(duì)于AI的態(tài)度越來越務(wù)實(shí)。他們希望在邊緣設(shè)備執(zhí)行AI而非在云端進(jìn)行,以避免隱私、延遲和成本等問題?!?/p>
聯(lián)發(fā)科技(MedaTek)首席財(cái)務(wù)官顧大為對(duì)此表示認(rèn)同。相較于亞馬遜在其Echo設(shè)備中推動(dòng)云端到云端的服務(wù),聯(lián)發(fā)科看到了“邊緣和云端”融合模式的可能性。他在CES時(shí)告訴我們,語(yǔ)音助理競(jìng)賽如今已經(jīng)著重于在本地增加“智慧”、區(qū)別人類與非人類的聲音分開、消除背景音樂、辨識(shí)聲音模式等。
Petcube Wi-Fi寵物照相在遠(yuǎn)程進(jìn)行機(jī)監(jiān)測(cè)并與寵物互動(dòng)(來源:Petcube)
Wertheizer說:“以Petcube設(shè)計(jì)的交互式Wi-Fi寵物相機(jī)為例,它能在主人不在家時(shí),透過雙向音訊和1080p高分辨率(HD)視頻攝影機(jī)進(jìn)行監(jiān)控,以及與狗或貓互動(dòng)”。Wertheizer說:“我不確定Petcube是否意識(shí)到這是一家物聯(lián)網(wǎng)公司。但是,像這樣的連網(wǎng)產(chǎn)品中,語(yǔ)音識(shí)別系統(tǒng)顯然必須能夠辨識(shí)狗吠聲,并且確定狗是處于壓力還是處于危機(jī)之中。換句話說,系統(tǒng)需要有智能才能進(jìn)行學(xué)習(xí)。”
Neupro低功耗AI處理器
雖然Ceva為語(yǔ)音系統(tǒng)的設(shè)計(jì)者提供了名為ClearVox的語(yǔ)音算法,但它也知道系統(tǒng)廠商需要的更多。系統(tǒng)制造商希望在其物聯(lián)網(wǎng)設(shè)備中整合學(xué)習(xí)和推論的能力,使其產(chǎn)品能夠持續(xù)變得更加智能化。
目前的市場(chǎng)上亟需AI處理器。為了滿足這一需求,Ceva在CES上推出了NuePro,這是一款“專用的低功耗AI處理器系列,用于在邊緣進(jìn)行深度學(xué)習(xí)”。NuePro是一款獨(dú)立的專用AI處理器,可廣泛用于物聯(lián)網(wǎng)、智能手機(jī)、安全監(jiān)控、汽車、機(jī)器人、醫(yī)療和工業(yè)等市場(chǎng)。
Ceva推出AI處理器(來源:Ceva)
值得注意的是,Ceva并非深度學(xué)習(xí)領(lǐng)域的新手。據(jù)報(bào)導(dǎo),NeuPro是以Ceva在計(jì)算機(jī)視覺應(yīng)用深層神經(jīng)網(wǎng)絡(luò)方面的經(jīng)驗(yàn)為基礎(chǔ)。
Wertheizer說,NeuPro AI處理器是Ceva從頭開始研發(fā)的第一款“非DSP”技術(shù)。他在發(fā)布Neupro時(shí)說:“我有點(diǎn)緊張。但是你必須知道AI并不是訊號(hào)處理方面的問題?!?/p>
NeuPro處理器搭載兩個(gè)硬件——NeuPro引擎和NeuPro VPU (向量處理單元)。Wertheizer指出,雖然引擎處理定義良好的人工智能算法,如CNN、啟動(dòng)和規(guī)范層,但是,可編程的向量引擎NeuPro VPU是執(zhí)行專有AI算法的一種延伸?!拔覀冞x擇了這種硬聯(lián)機(jī)的建置方式,而不是使用GPU或CPU,讓我們能夠增加AI處理器的利用率。”
Ceva聲稱,這款新的專用AI處理器系列帶來了“相當(dāng)高的性能提升,從入門級(jí)處理器的2TOPS到為最高階配置的12.5TOPS”。
NeuPro硬件模塊;Ceva首席執(zhí)行官Gideon Wertheizer強(qiáng)調(diào),“NeuPro VPU和NeuPro引擎之間的無(wú)縫切換至關(guān)重要”。 (來源:Ceva)
Ceva表示,NeuPro AI處理器將于2018年第二季向客戶提供授權(quán),并計(jì)劃在第三季全面發(fā)布。
同樣地,聯(lián)發(fā)科準(zhǔn)備推出一款由意騰科技(Intelligo Technology)設(shè)計(jì)的AI處理器和算法。Intelligo是2016年時(shí)從聯(lián)發(fā)科獨(dú)立而出的新創(chuàng)公司。
Intelligo設(shè)計(jì)的這款A(yù)I SoC被稱為“智能DNN語(yǔ)音處理器”應(yīng)用范圍較有限。聯(lián)發(fā)科表示,該處理器提供“可配置的深度神經(jīng)網(wǎng)絡(luò)和高效率推論引擎(每秒每瓦特1 TOPS運(yùn)算性能)”。
顧大為表示,聯(lián)發(fā)科正在尋找一種小型的AI加速器,為辨識(shí)20到30個(gè)關(guān)鍵詞而設(shè)計(jì)。另一方面,聯(lián)發(fā)科也正推廣其“分布式處理”的觀念,期望語(yǔ)音和AI功能不只是整合于像Echo或Google Home的智能音箱,而是更落實(shí)于廣泛的小型設(shè)備——如電燈開關(guān)。
-
CES
+關(guān)注
關(guān)注
4文章
1014瀏覽量
70700 -
語(yǔ)音
+關(guān)注
關(guān)注
3文章
381瀏覽量
37975 -
人工智能
+關(guān)注
關(guān)注
1790文章
46670瀏覽量
237111
原文標(biāo)題:語(yǔ)音和人工智能應(yīng)用在CES 2018上的爆發(fā)
文章出處:【微信號(hào):gh_bee81f890fc1,微信公眾號(hào):面包板社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論