0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

關(guān)于五麥克風(fēng)環(huán)形陣列的分析

訊飛開放平臺 ? 來源:djl ? 2019-10-08 10:46 ? 次閱讀

訊飛五麥震撼來襲

科大訊飛是國際上最早開始研究遠(yuǎn)場語音識別技術(shù)的機(jī)構(gòu)之一,也是國內(nèi)唯一具備成熟解決方案的廠商。自2015年3月和8月,訊飛相繼對外發(fā)布四麥、二麥麥克風(fēng)陣列解決方案。今天在深圳阿基米互聯(lián)網(wǎng)公社舉辦的“訊飛核心技術(shù)開發(fā)日——麥入云端,引領(lǐng)智能交互新主義”沙龍活動中,更重磅發(fā)布了打破語音交互瓶頸的利器——4+1環(huán)形五麥克風(fēng)陣列,再次引領(lǐng)智能交互新主義!

在科大訊飛15年底年度發(fā)布會上,在場的3000余人見證了這樣的一場人機(jī)互動:演示人員在5米開外,用聲音操控叮咚音箱,完成了一系列高難度的訂票任務(wù),引來臺下陣陣驚嘆——現(xiàn)場那么嘈雜,叮咚音箱卻如此“聽話”,要讓叮咚音箱聽懂這么多聲音,而且具備遠(yuǎn)場識別的功能,它必須聽的到,而且要聽的更加清晰,人類可以帶上助聽器,機(jī)器需要什么呢?【麥克風(fēng)陣列】就充當(dāng)了助聽器這樣的角色??梢哉f,麥克風(fēng)陣列猶如遠(yuǎn)場識別的心臟。有了這顆“機(jī)器之心”, 在遠(yuǎn)場場景中,就可以一舉解決在了遠(yuǎn)場識別中遇到的背景噪聲、其他人聲干擾、回聲、混響等核心問題。

圖:“麥入云端,引領(lǐng)智能交互新主義”沙龍活動現(xiàn)場

定義人機(jī)交互的標(biāo)準(zhǔn)

訊飛開放平臺副總經(jīng)理馬漢君進(jìn)行了開場演講,馬漢君以”科大訊飛——人工智能引導(dǎo)者“為主題系統(tǒng)地介紹了人工智能的起源和發(fā)展,以及訊飛在人工智能領(lǐng)域里的最新研究成果和在人工智能+IOT時代的愿景和目標(biāo),并在演講的最后詳細(xì)的闡述了于去年底發(fā)布的人機(jī)交互界面——AIUI。

圖:訊飛開放平臺副總經(jīng)理馬漢君

馬漢君說:“人工智能將助力IOT時代的蓬勃興起,而科大訊飛的愿景則是加速這一過程。當(dāng)前訊飛的自然開放交互平臺上的應(yīng)用已經(jīng)超過90000個,連接終端超過8.8億臺。接下來訊飛將通過深度神經(jīng)網(wǎng)絡(luò)與大數(shù)據(jù)的結(jié)合,實(shí)現(xiàn)人工智能從“能聽會說”到“能理解會思考”的突破。2014年8月,科大訊飛成為中國首個人工智能項目“類人答題機(jī)器人”的牽頭單位,正式啟動超腦計劃。未來,訊飛超腦將能參加高考甚至取得“一本”的成績。

在2015年,訊飛發(fā)布了AIUI,這是一個智能硬件量身定制了智能交互方案,重新定義了萬物互聯(lián)時代人機(jī)語音交互標(biāo)準(zhǔn),具備了遠(yuǎn)場降噪、方言識別、語音糾錯、多輪對話等功能。通過統(tǒng)一接口、開放的服務(wù)擴(kuò)展、靈活的能力搭配實(shí)現(xiàn)人機(jī)交互與產(chǎn)品體驗的結(jié)合,科大訊飛希望和合作伙伴一起,用人工智能改變世界。

智能交互,與聲俱來

訊飛開放平臺智能硬件產(chǎn)品總監(jiān)張良春則從人機(jī)交互的三大痛點(diǎn)談起,介紹了訊飛在這些問題的看法以及解決之道?!耙Ф洹辈皇侵悄芙换?,讓機(jī)器人可以遠(yuǎn)場對話,需要使用麥克風(fēng)陣列?,F(xiàn)在訊飛推出有最新的環(huán)形五麥克風(fēng)陣列,遠(yuǎn)場拾音距離可達(dá)5米。相比以往線性麥克風(fēng)單維180°覆蓋,環(huán)形五麥?zhǔn)?60°全平面拾音角度,而且去噪效果更好,抗環(huán)境噪音的能力更強(qiáng)。

總的來說五麥麥克風(fēng)陣列功能特性包括:二維空間拾音、抗噪能力增強(qiáng)、遠(yuǎn)距拾取音頻、支持連續(xù)喚醒、支持回聲消除、支持語音打斷。麥克風(fēng)陣列模塊優(yōu)點(diǎn)是迅速集成,缺點(diǎn)成本較高,適合小批量。所以訊飛也可以提供麥克風(fēng)軟核方案,包括算法SDK、錄音板、加密芯片和構(gòu)型說明。目前軟核方案有單麥軟核、雙麥軟核、四麥線性軟核、環(huán)形五麥軟核和環(huán)形七麥軟核。環(huán)形七麥支持5~7米拾音距離、360°聲源定位、±10°聲源定位精度,陣列錄入的音頻信噪比更高。

圖:訊飛開放平臺智能硬件產(chǎn)品總監(jiān)張良春

在演講的中,張良春還風(fēng)趣的套用了周星馳電影國產(chǎn)凌凌漆中的一個橋段:咱們的產(chǎn)品只要一開口說話,無論在哪里,都像黑暗中的一只螢火蟲,那樣的鮮明,那樣的出眾……

干貨泥濘的麥克風(fēng)陣列技術(shù)剖析

除了邀請訊飛開放平臺的相關(guān)同事,此次發(fā)布會還特意從訊飛研究院邀請了信號處理領(lǐng)域的技術(shù)大牛王海坤博士。而王博士的發(fā)言無疑讓此次本便干貨滿滿發(fā)布會變得更加泥濘。王博士從信號與信號聲學(xué)處理談起,全面的剖析了訊飛的麥克風(fēng)陣列與回聲消除技術(shù)。

“噪聲、混響、干擾和回聲是聲學(xué)信號處理需要解決的問題,而這些問題的解決離不開麥克風(fēng)陣列。訊飛采用聲源定位技術(shù),利用麥克風(fēng)陣列用基于TDOA(到達(dá)時間差)計算聲源距離陣列的角度和距離,實(shí)現(xiàn)對目標(biāo)聲源的跟蹤。再通過波束形成技術(shù),即在期望方向上有效地形成一個波束,僅拾取波束的信號,從而達(dá)到同時提取聲源和抑制噪聲的目的。對于混響,則使用麥克風(fēng)陣列+深度學(xué)習(xí),實(shí)現(xiàn)有效的混響處理“。

圖:訊飛研究院王海坤

“科大訊飛的回聲消除技術(shù)更是達(dá)到國際頂尖水平,利用自適應(yīng)濾波方法估計回聲路徑和利用參考信號求得麥克風(fēng)拾取的喇叭聲音,并將其減去。通過這一系列的技術(shù),訊飛麥克風(fēng)陣列實(shí)現(xiàn)了優(yōu)異的聲學(xué)信號處理,確保了良好的用戶體驗”。

智能硬件客,共享語音云

發(fā)布會最后做壓軸演講的,是訊飛開放平臺智能硬件商務(wù)總監(jiān)湯熙,湯熙以“生活不止眼前的茍且,還有詩和遠(yuǎn)方的田野”生動開場,著重介紹了開發(fā)者獲取訊飛開放平臺相關(guān)能力的一套流程。

圖:訊飛開放平臺智能硬件商務(wù)總監(jiān)湯熙

湯熙最后表示:如果你確定與訊飛合作,訊飛將提供深入對接的全套服務(wù)。我們在深圳、北京、合肥都有支持團(tuán)隊,除了技術(shù)支持+商務(wù)本地化服務(wù)外,訊飛還提供包括資本服務(wù)、宣傳服務(wù)、渠道服務(wù)等多種服務(wù)。我們希望在做好服務(wù)的同時,陪伴大家共同成長。訊飛會不斷把核心技術(shù)做好,產(chǎn)品打磨好,把本地支持做好,只有這樣才能陪伴大家往前走。訊飛也許不夠完美,但是完美的訊飛需要大家一起締造。

麥克風(fēng)猶如遠(yuǎn)場識別的心臟和引擎,在其基礎(chǔ)上,遠(yuǎn)場識別技術(shù)的遠(yuǎn)距離、高識別率支撐,現(xiàn)在用戶在以家庭為單位的活動范圍內(nèi),可以通過語音輕松操控家里的一切智能硬件設(shè)備,推而廣之,搭載遠(yuǎn)場識別的智能硬件產(chǎn)品將無限擴(kuò)大適用范圍和應(yīng)用場景。未來,科大訊飛將依靠自身強(qiáng)大的人工智能科研實(shí)力與優(yōu)質(zhì)產(chǎn)品,更具創(chuàng)造性地去改變世界,讓人們的生活更加美好。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 助聽器
    +關(guān)注

    關(guān)注

    18

    文章

    167

    瀏覽量

    40320
  • 人工智能
    +關(guān)注

    關(guān)注

    1791

    文章

    46697

    瀏覽量

    237182
收藏 人收藏

    評論

    相關(guān)推薦

    TWL6040如何激活麥克風(fēng)?

    各位高手們,我現(xiàn)在使用TWL6040音頻芯片,想請教下如何激活麥克風(fēng),我之前使用到 是熊貓板,后來看了原理圖之后,熊貓板上麥克風(fēng)都被接地了,只留下了FM通道,后來我們自己做了一塊板子,錄完音之后播放都是無聲的,想請教下,如果激活麥克風(fēng)
    發(fā)表于 11-05 07:05

    鼎盛合 UHF無線麥克風(fēng)方案

    在當(dāng)今音頻技術(shù)飛速發(fā)展的時代,無線麥克風(fēng)以其便捷性、靈活性和高質(zhì)量的音頻傳輸能力,在眾多領(lǐng)域中得到了廣泛的應(yīng)用。而在無線麥克風(fēng)方案中,主控芯片起著至關(guān)重要的作用。本文將圍繞無線麥克風(fēng)方案與主控芯片
    的頭像 發(fā)表于 10-28 16:44 ?241次閱讀

    TLV320ADC6140和8個PDM麥克風(fēng)設(shè)計麥克風(fēng)陣列,使用TDM格式輸出,每個麥克風(fēng)輸出相位是什么樣的?

    以前使用的是模擬麥克風(fēng),使用兩個4路輸入的CODEC,I2S格式,為了保證時鐘同步,后面使用FPGA進(jìn)行同步采樣,設(shè)計8麥克風(fēng)陣列效果還可以。為了簡化設(shè)計6140+8個PDM話筒,配置安裝手冊
    發(fā)表于 10-12 08:12

    Sitara Linux ALSA DSP麥克風(fēng)陣列語音識別

    電子發(fā)燒友網(wǎng)站提供《Sitara Linux ALSA DSP麥克風(fēng)陣列語音識別.pdf》資料免費(fèi)下載
    發(fā)表于 10-10 09:13 ?0次下載
    Sitara Linux ALSA DSP<b class='flag-5'>麥克風(fēng)</b><b class='flag-5'>陣列</b>語音識別

    主流的麥克風(fēng)陣列有哪些?

    麥克風(fēng)陣列在HiFi音頻解決方案中的重要性體現(xiàn)在它對音質(zhì)提升的全面貢獻(xiàn)。通過精準(zhǔn)的聲源定位、噪聲抑制、空間感增強(qiáng)和智能處理,麥克風(fēng)陣列為HiFi音頻系統(tǒng)提供了卓越的聲音采集和再現(xiàn)能力,
    的頭像 發(fā)表于 10-08 20:52 ?495次閱讀
    主流的<b class='flag-5'>麥克風(fēng)</b><b class='flag-5'>陣列</b>有哪些?

    一文全了解麥克風(fēng)陣列

    什么是麥克風(fēng)陣列? 想象一下一個小型音響部隊在你面前,它們站成一排,用不同的麥克風(fēng)捕捉聲音。這就是麥克風(fēng)陣列的基本概念。
    的頭像 發(fā)表于 09-03 16:03 ?1037次閱讀
    一文全了解<b class='flag-5'>麥克風(fēng)</b><b class='flag-5'>陣列</b>

    麥克風(fēng)的 Turnkey 解決方案

    麥克風(fēng)的 Turnkey 解決方案提供了從硬件設(shè)計到系統(tǒng)集成的全面支持,通過高質(zhì)量的麥克風(fēng)技術(shù)解決了在各種應(yīng)用場景中遇到的音頻清晰度、噪聲抑制和設(shè)備集成等問題。無論是在專業(yè)錄音、公共演講還是智能設(shè)備中,選擇合適的麥克風(fēng)方案可以顯
    的頭像 發(fā)表于 08-16 22:45 ?347次閱讀
    <b class='flag-5'>麥克風(fēng)</b>的 Turnkey 解決方案

    7麥克風(fēng)陣列設(shè)計思路和工作原理

    7麥陣列(7-microphone array)是一種先進(jìn)的聲音捕捉技術(shù),它在現(xiàn)代科技生活中扮演著重要角色。這種技術(shù)利用了多個麥克風(fēng)并結(jié)合信號處理算法,能夠在各種環(huán)境中準(zhǔn)確捕捉和分析聲音,從而解決了許多實(shí)際生活中的問題。
    的頭像 發(fā)表于 06-25 16:27 ?599次閱讀
    7<b class='flag-5'>麥克風(fēng)</b><b class='flag-5'>陣列</b>設(shè)計思路和工作原理

    什么是AI麥克風(fēng)陣列解決方案?

    什么是AI麥克風(fēng)陣列解決方案? 想象一下,你站在一個音樂會的舞臺上,周圍有一群超級聰明的小助手,他們每個人手里拿著一只麥克風(fēng),分散在舞臺的各個角落。這些小助手不僅能聽到你的聲音,還能幫你把聲音變得更清晰,甚至能告訴你觀眾的歡呼
    的頭像 發(fā)表于 06-14 16:19 ?605次閱讀
    什么是AI<b class='flag-5'>麥克風(fēng)</b><b class='flag-5'>陣列</b>解決方案?

    飛騰云XMOS AI麥克風(fēng)陣列解決方案

    在現(xiàn)代家庭和辦公環(huán)境中,實(shí)現(xiàn)高清晰度的語音交互成為諸多智能設(shè)備的關(guān)鍵需求。無論是在廚房、客廳、健身房還是會議室和教室,我們的 XMOS AI麥克風(fēng)陣列解決方案 致力于在各種嘈雜環(huán)境中捕捉干凈、清晰的人聲。
    的頭像 發(fā)表于 05-28 17:20 ?542次閱讀
    飛騰云XMOS AI<b class='flag-5'>麥克風(fēng)</b><b class='flag-5'>陣列</b>解決方案

    麥克風(fēng)陣列解決方案

    飛騰云XMOS AI麥克風(fēng)陣列解決方案不僅是技術(shù)上的進(jìn)步,也是通往智能交互未來的一大步。
    的頭像 發(fā)表于 05-16 16:00 ?599次閱讀

    麥克風(fēng)陣列雙通道降噪拾音模組A-59

    麥克風(fēng)模組
    深圳德宇科技有限公司
    發(fā)布于 :2024年03月29日 10:23:11

    無線麥克風(fēng)音頻方案

    無線麥克風(fēng)是音頻傳輸領(lǐng)域的一項重要技術(shù),廣泛應(yīng)用于演講、表演、會議等場合。而無線麥克風(fēng)的音頻方案中,無線芯片起著關(guān)鍵作用。下面將介紹無線麥克風(fēng)音頻方案中的技術(shù)要點(diǎn)和優(yōu)勢。 首先,無線麥克風(fēng)
    的頭像 發(fā)表于 02-26 15:22 ?731次閱讀

    快思聰Crestron Automate VX現(xiàn)已支持森海塞爾TCC M天花陣列麥克風(fēng)

    快思聰Crestron Automate VX現(xiàn)已支持森海塞爾TCC M天花陣列麥克風(fēng) 重要戰(zhàn)略合作伙伴在多攝像頭切換解決方案中集成森海塞爾最新天花陣列麥克風(fēng),推動更平等的會議體驗 德
    的頭像 發(fā)表于 01-08 22:54 ?450次閱讀

    麥克風(fēng)陣列波束成形應(yīng)用案例

    電子發(fā)燒友網(wǎng)站提供《麥克風(fēng)陣列波束成形應(yīng)用案例.pdf》資料免費(fèi)下載
    發(fā)表于 11-23 11:34 ?9次下載
    <b class='flag-5'>麥克風(fēng)</b><b class='flag-5'>陣列</b>波束成形應(yīng)用案例