在此次的CES2018展會上,眾多廠商紛紛發(fā)布了自己最新的技術(shù)和產(chǎn)品。毫無疑問,人工智能(AI)是此次CES展會的一大熱點(diǎn)。NVIDIA公布全新的用于自動駕駛的AI芯片Xavier SoC;瑞芯微也發(fā)布了自己的首款A(yù)I芯片RK3399Pro;聯(lián)發(fā)科宣布推出NeuroPilot AI平臺,主打跨平臺終端人工智能。與此同時,國內(nèi)專注于聲紋識別領(lǐng)域的初創(chuàng)公司SpeakIn的聲紋識別芯片及模組也被曝光。而這也將是全球首款專用于聲紋識別的AI芯片和模組。
據(jù)了解,SpeakIn推出的這款聲紋算法模組集成了一顆微處理器,內(nèi)存,雙路ADC和硬件降噪,前端AGC自動增益控制,硬件音頻編碼譯碼器和WiFi 802.11 ac。更為關(guān)鍵的是,其中還集成了40GFlops聲紋驗算單元,搭載了SpeakIn的聲紋模型庫,可以在離線狀態(tài)下實現(xiàn)本地化的智能采集和驗證,更為快速和便捷。當(dāng)然,如果是在線狀態(tài)下,還可連接SpeakIn云平臺,進(jìn)行聲紋大數(shù)據(jù)檢索與比對,動態(tài)聲紋數(shù)據(jù)同步,提供端+云的全方位解決方案。
此外,SpeakIn的這款聲紋算法模組在接口方面也比較齊全,不僅集成了主流GPIO和高保真音頻接口,還支持千兆以太網(wǎng)。
可以說,SpeakIn推出的這款聲紋算法模組就是一個完整的可獨(dú)立運(yùn)行的支持聲紋識別的小電腦,并且具備通用擴(kuò)展性和前向支持能力。同時,整個模塊的功耗也非常低,據(jù)說僅2Wh。此外,模塊的體積也比較小,而且模組的尺寸和高度也是因為集成了內(nèi)存芯片和嵌入了許多接口,而在實際應(yīng)用中,這些接口是可以嵌入在硬件設(shè)備上的,所以模組的尺寸和高度都是也是可以根據(jù)需要進(jìn)行調(diào)整的,非常便于集成。
我們都知道,為了推動語音識別的應(yīng)用,眾多的語音識別廠商此前都有聯(lián)合芯片廠商推出自己的語音識別模組,或者推出自己的麥克風(fēng)陣列方案,以提升語音識別的體驗,而這些動作也確實加速了語音識別市場的發(fā)展。同樣,隨著SpeakIn的這款聲紋識別模組的推出,也或?qū)⒓铀俾暭y識別的普及應(yīng)用。
聲紋識別將成語音人機(jī)交互的最佳身份認(rèn)證方式
隨著語音/聲學(xué)以及人工智能技術(shù)的發(fā)展,語音已經(jīng)被認(rèn)為是下一代人機(jī)交互關(guān)鍵技術(shù)(交互更簡單,更自然)。目前亞馬遜、蘋果、谷歌等海外巨頭,以及國內(nèi)的阿里、百度、騰訊等眾多廠商都推出了自己的智能音箱產(chǎn)品,并且都集成了自己的智能語音助手。在此次的CES展會上,集成智能語音助手的設(shè)備可謂是隨處可見,可以預(yù)見語音交互將成為未來最為重要一種人機(jī)交互方式,與此同時聲紋識別技術(shù)也開始煥發(fā)出了新的生命。
首先,不論對于智能音箱這樣的家用設(shè)備,還是智能手機(jī)這樣的私人設(shè)備,用戶隱私及安全都是必須要考慮的問題。而在單純的通過語音交互的場景之下,傳統(tǒng)的指紋識別、虹膜識別,乃至于新的人臉識別等用于保護(hù)用戶隱私及安全的生物認(rèn)證方式并不適用,也不便捷。比如我們對智能音箱說,“幫我來定個昨天中午一樣的外賣”,如果有了聲紋識別作為身份認(rèn)證方式,那么你通過這一句話就能夠完成整個訂餐及支付操作。如果沒有聲紋識別,那么到了支付環(huán)節(jié),可能還是需要通過智能手機(jī)上的指紋識別/人臉識別來完成認(rèn)證的步驟,這顯然很麻煩。當(dāng)然,我們也可以通過語音讀出密碼的方式來完成,但是這顯然不利于隱私保護(hù)。
其次,對于用戶來說,每個人都有不同的使用習(xí)慣和偏好,而智能語音助手則完全有能力在同一終端實現(xiàn)實現(xiàn)千人千面的個性化服務(wù)。通過聲紋識別來作為身份識別方式,則可以非常自然的實現(xiàn)身份的切換。比如,在家庭當(dāng)中,當(dāng)你對智能音箱說,“幫我定個昨天中午一樣的快餐”,同時你的哥哥也說“幫我也定一個昨天中午一樣的快餐”,注意這里可能你們兩個人昨天中午定的快餐是完全不一樣的,如果有了聲紋識別,就能夠識別兩個語義完全相同的語音指令是由哪兩個人所發(fā)出的,然后根據(jù)這兩個人的不同的習(xí)慣(昨天中午這兩個人分別定的是什么快餐),來滿足不同的需求。顯然,這樣的用戶體驗,是其他生物識別方式所難以實現(xiàn)的。比如人臉識別,確實可以實現(xiàn)同時對于多個用戶的身份識別,但是你要定個快餐,卻沒法直接通過人臉來下達(dá)指令。
另外,聲紋識別還具有一些其他生物識別技術(shù)所沒有的優(yōu)勢。比如,聲紋識別是非接觸式的,可以通過語音傳遞進(jìn)行聲紋信息,從而不用接觸到機(jī)器本身,就可以進(jìn)行聲音識別。這兩個特點(diǎn)有使得聲紋識別可以應(yīng)用在很多領(lǐng)域,比如可以進(jìn)行遠(yuǎn)程認(rèn)證。
不過,聲音跟虹膜、人臉都存在同樣的受環(huán)境干擾的問題,比如人臉、虹膜會受到光學(xué)環(huán)境的干擾,而聲紋則會受到環(huán)境噪聲的干擾。當(dāng)然在沒有光的情況下是可以用聲紋識別的,如果是不能開口的情況下,則只能用其他的識別技術(shù)。
可以說,如果未來語音將作為重要的人機(jī)交互方式,那么聲紋識別則將是與之相匹配的最佳的身份認(rèn)證方式。
雖然目前生活當(dāng)中,聲紋識別似乎接觸的很少。但是,實際上,我們所熟悉的很多產(chǎn)品以及應(yīng)用都已經(jīng)開始加入了聲紋識別功能。
比如去年推出多款智能音箱產(chǎn)品其實都有加入了聲紋識別。蘋果iPhone 7之后的語音助手Siri也加入了聲紋識別功能。今年6月,騰訊推出Qrobot小Q機(jī)器人第二代也采用了聲紋識別技術(shù),而這款產(chǎn)品的聲紋識別技術(shù)就是由SpeakIn所提供的。
當(dāng)然,就目前來說,相比指紋識別、人臉識別、虹膜識別等生物識別技術(shù)來說,傳統(tǒng)的單純基于云端的聲紋識別技術(shù)還存在著一些不足,但是通過推出專用的聲紋識別硬件模組,在終端側(cè)進(jìn)行部署,通過邊緣計算+云端人工智能的方式,將會極大提升聲紋識別的準(zhǔn)確率和實用性。期待SpeakIn能夠給我們帶來不一樣的體驗。
-
CES
+關(guān)注
關(guān)注
4文章
1014瀏覽量
70699 -
AI
+關(guān)注
關(guān)注
87文章
29806瀏覽量
268106 -
聲紋識別
+關(guān)注
關(guān)注
3文章
137瀏覽量
21490
原文標(biāo)題:智能語音助手設(shè)備大熱,全球首款聲紋識別芯片及模組曝光!
文章出處:【微信號:icsmart,微信公眾號:芯智訊】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論