訊飛五麥震撼來襲
科大訊飛是國際上最早開始研究遠(yuǎn)場語音識別技術(shù)的機(jī)構(gòu)之一,也是國內(nèi)唯一具備成熟解決方案的廠商。自2015年3月和8月,訊飛相繼對外發(fā)布四麥、二麥麥克風(fēng)陣列解決方案。今天在深圳阿基米互聯(lián)網(wǎng)公社舉辦的“訊飛核心技術(shù)開發(fā)日——麥入云端,引領(lǐng)智能交互新主義”沙龍活動中,更重磅發(fā)布了打破語音交互瓶頸的利器——4+1環(huán)形五麥克風(fēng)陣列,再次引領(lǐng)智能交互新主義!
在科大訊飛15年底年度發(fā)布會上,在場的3000余人見證了這樣的一場人機(jī)互動:演示人員在5米開外,用聲音操控叮咚音箱,完成了一系列高難度的訂票任務(wù),引來臺下陣陣驚嘆——現(xiàn)場那么嘈雜,叮咚音箱卻如此“聽話”,要讓叮咚音箱聽懂這么多聲音,而且具備遠(yuǎn)場識別的功能,它必須聽的到,而且要聽的更加清晰,人類可以帶上助聽器,機(jī)器需要什么呢?【麥克風(fēng)陣列】就充當(dāng)了助聽器這樣的角色??梢哉f,麥克風(fēng)陣列猶如遠(yuǎn)場識別的心臟。有了這顆“機(jī)器之心”, 在遠(yuǎn)場場景中,就可以一舉解決在了遠(yuǎn)場識別中遇到的背景噪聲、其他人聲干擾、回聲、混響等核心問題。
圖:“麥入云端,引領(lǐng)智能交互新主義”沙龍活動現(xiàn)場
定義人機(jī)交互的標(biāo)準(zhǔn)
訊飛開放平臺副總經(jīng)理馬漢君進(jìn)行了開場演講,馬漢君以”科大訊飛——人工智能引導(dǎo)者“為主題系統(tǒng)地介紹了人工智能的起源和發(fā)展,以及訊飛在人工智能領(lǐng)域里的最新研究成果和在人工智能+IOT時代的愿景和目標(biāo),并在演講的最后詳細(xì)的闡述了于去年底發(fā)布的人機(jī)交互界面——AIUI。
圖:訊飛開放平臺副總經(jīng)理馬漢君
馬漢君說:“人工智能將助力IOT時代的蓬勃興起,而科大訊飛的愿景則是加速這一過程。當(dāng)前訊飛的自然開放交互平臺上的應(yīng)用已經(jīng)超過90000個,連接終端超過8.8億臺。接下來訊飛將通過深度神經(jīng)網(wǎng)絡(luò)與大數(shù)據(jù)的結(jié)合,實(shí)現(xiàn)人工智能從“能聽會說”到“能理解會思考”的突破。2014年8月,科大訊飛成為中國首個人工智能項目“類人答題機(jī)器人”的牽頭單位,正式啟動超腦計劃。未來,訊飛超腦將能參加高考甚至取得“一本”的成績。
在2015年,訊飛發(fā)布了AIUI,這是一個智能硬件量身定制了智能交互方案,重新定義了萬物互聯(lián)時代人機(jī)語音交互標(biāo)準(zhǔn),具備了遠(yuǎn)場降噪、方言識別、語音糾錯、多輪對話等功能。通過統(tǒng)一接口、開放的服務(wù)擴(kuò)展、靈活的能力搭配實(shí)現(xiàn)人機(jī)交互與產(chǎn)品體驗的結(jié)合,科大訊飛希望和合作伙伴一起,用人工智能改變世界。
智能交互,與聲俱來
訊飛開放平臺智能硬件產(chǎn)品總監(jiān)張良春則從人機(jī)交互的三大痛點(diǎn)談起,介紹了訊飛在這些問題的看法以及解決之道?!耙Ф洹辈皇侵悄芙换?,讓機(jī)器人可以遠(yuǎn)場對話,需要使用麥克風(fēng)陣列?,F(xiàn)在訊飛推出有最新的環(huán)形五麥克風(fēng)陣列,遠(yuǎn)場拾音距離可達(dá)5米。相比以往線性麥克風(fēng)單維180°覆蓋,環(huán)形五麥?zhǔn)?60°全平面拾音角度,而且去噪效果更好,抗環(huán)境噪音的能力更強(qiáng)。
總的來說五麥麥克風(fēng)陣列功能特性包括:二維空間拾音、抗噪能力增強(qiáng)、遠(yuǎn)距拾取音頻、支持連續(xù)喚醒、支持回聲消除、支持語音打斷。麥克風(fēng)陣列模塊優(yōu)點(diǎn)是迅速集成,缺點(diǎn)成本較高,適合小批量。所以訊飛也可以提供麥克風(fēng)軟核方案,包括算法SDK、錄音板、加密芯片和構(gòu)型說明。目前軟核方案有單麥軟核、雙麥軟核、四麥線性軟核、環(huán)形五麥軟核和環(huán)形七麥軟核。環(huán)形七麥支持5~7米拾音距離、360°聲源定位、±10°聲源定位精度,陣列錄入的音頻信噪比更高。
圖:訊飛開放平臺智能硬件產(chǎn)品總監(jiān)張良春
在演講的中,張良春還風(fēng)趣的套用了周星馳電影國產(chǎn)凌凌漆中的一個橋段:咱們的產(chǎn)品只要一開口說話,無論在哪里,都像黑暗中的一只螢火蟲,那樣的鮮明,那樣的出眾……
干貨泥濘的麥克風(fēng)陣列技術(shù)剖析
除了邀請訊飛開放平臺的相關(guān)同事,此次發(fā)布會還特意從訊飛研究院邀請了信號處理領(lǐng)域的技術(shù)大牛王海坤博士。而王博士的發(fā)言無疑讓此次本便干貨滿滿發(fā)布會變得更加泥濘。王博士從信號與信號聲學(xué)處理談起,全面的剖析了訊飛的麥克風(fēng)陣列與回聲消除技術(shù)。
“噪聲、混響、干擾和回聲是聲學(xué)信號處理需要解決的問題,而這些問題的解決離不開麥克風(fēng)陣列。訊飛采用聲源定位技術(shù),利用麥克風(fēng)陣列用基于TDOA(到達(dá)時間差)計算聲源距離陣列的角度和距離,實(shí)現(xiàn)對目標(biāo)聲源的跟蹤。再通過波束形成技術(shù),即在期望方向上有效地形成一個波束,僅拾取波束的信號,從而達(dá)到同時提取聲源和抑制噪聲的目的。對于混響,則使用麥克風(fēng)陣列+深度學(xué)習(xí),實(shí)現(xiàn)有效的混響處理“。
圖:訊飛研究院王海坤
“科大訊飛的回聲消除技術(shù)更是達(dá)到國際頂尖水平,利用自適應(yīng)濾波方法估計回聲路徑和利用參考信號求得麥克風(fēng)拾取的喇叭聲音,并將其減去。通過這一系列的技術(shù),訊飛麥克風(fēng)陣列實(shí)現(xiàn)了優(yōu)異的聲學(xué)信號處理,確保了良好的用戶體驗”。
智能硬件客,共享語音云
發(fā)布會最后做壓軸演講的,是訊飛開放平臺智能硬件商務(wù)總監(jiān)湯熙,湯熙以“生活不止眼前的茍且,還有詩和遠(yuǎn)方的田野”生動開場,著重介紹了開發(fā)者獲取訊飛開放平臺相關(guān)能力的一套流程。
圖:訊飛開放平臺智能硬件商務(wù)總監(jiān)湯熙
湯熙最后表示:如果你確定與訊飛合作,訊飛將提供深入對接的全套服務(wù)。我們在深圳、北京、合肥都有支持團(tuán)隊,除了技術(shù)支持+商務(wù)本地化服務(wù)外,訊飛還提供包括資本服務(wù)、宣傳服務(wù)、渠道服務(wù)等多種服務(wù)。我們希望在做好服務(wù)的同時,陪伴大家共同成長。訊飛會不斷把核心技術(shù)做好,產(chǎn)品打磨好,把本地支持做好,只有這樣才能陪伴大家往前走。訊飛也許不夠完美,但是完美的訊飛需要大家一起締造。
麥克風(fēng)猶如遠(yuǎn)場識別的心臟和引擎,在其基礎(chǔ)上,遠(yuǎn)場識別技術(shù)的遠(yuǎn)距離、高識別率支撐,現(xiàn)在用戶在以家庭為單位的活動范圍內(nèi),可以通過語音輕松操控家里的一切智能硬件設(shè)備,推而廣之,搭載遠(yuǎn)場識別的智能硬件產(chǎn)品將無限擴(kuò)大適用范圍和應(yīng)用場景。未來,科大訊飛將依靠自身強(qiáng)大的人工智能科研實(shí)力與優(yōu)質(zhì)產(chǎn)品,更具創(chuàng)造性地去改變世界,讓人們的生活更加美好。
-
助聽器
+關(guān)注
關(guān)注
18文章
167瀏覽量
40320 -
人工智能
+關(guān)注
關(guān)注
1791文章
46697瀏覽量
237182
發(fā)布評論請先 登錄
相關(guān)推薦
評論