0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

深度解讀Gating類型自動混音技術(shù)(2)

嵌入式DSP ? 來源:未知 ? 作者:工程師飛燕 ? 2018-10-21 09:56 ? 次閱讀

在上一篇 “Gating自動混音器(一)“,我們已經(jīng)了解了Gating自動混音器是干什么用的,它主要解決的問題是什么。在有多個麥克風(fēng)的場景下,傳統(tǒng)的做法是將多個麥克風(fēng)混音輸出到音箱。這樣的做法不可取,它可能導(dǎo)致的問題是,一、及其容易產(chǎn)生嘯叫,因為2路信號混音,總輸出增加3dB,更何況多支呢。二、即使可以通過增益比例去控制每只麥克風(fēng)在總輸出中占的比例,以達到總輸出不增加的目的,也非常容易導(dǎo)致說話人說話的聲音太小,聽不清楚。基于以上原因,才會有自動混音的出現(xiàn),自動混音徹徹底底地解決了根本問題。自動混音分為Gain-Sharing(增益共享)和Gating(門限)兩種類型,現(xiàn)在所講的是Gating類型自動混音。

上一期已經(jīng)講了Gating自動混音所應(yīng)具備的一些基本參數(shù)及含義,留下了一個關(guān)鍵點,自適應(yīng)噪聲閾值如何獲???在開始之前,先來看看為什么門限自動混音可以解決上邊提到的問題。

從圖中可以看出,每只麥克風(fēng)都有個Gate(門),當麥克風(fēng)信號超過這個門限以后,才會導(dǎo)通信號。通過的信號和普通混音無異,混音之后通過一個由NOM(打開的麥克風(fēng)數(shù)量)控制的衰減因子,達到總輸出不變的目的。 在多只麥克風(fēng)的情況下,不會存在每個人都會在同時說話,正在同時說話的麥克風(fēng)只有那么1-3只而已。其他未說話的麥克風(fēng)將被關(guān)閉,不會被導(dǎo)通。這樣既可以保證總輸出不產(chǎn)生反饋,每只麥克風(fēng)說話的聲音又可以聽得清楚。

NOM:Number Of Open Mics. 算法實時計算打開的麥克風(fēng)數(shù)量,如果大于NOM Limits 設(shè)定的數(shù)量,新打開的麥克風(fēng)將從已經(jīng)打開的麥克風(fēng)中搶占優(yōu)先級最低的一個, 如果沒有找到,該麥克風(fēng)不會被導(dǎo)通, NOM Limits起到一個限制作用。

在這里面,Gate是關(guān)鍵,如何保證麥克風(fēng)有信號的時候被打開,沒有人說話就不會被打開。簡單一點,可以采用對每一只麥克風(fēng)設(shè)置一個開關(guān)閾值,信號超過閾值的時候就導(dǎo)通,小于閾值就關(guān)閉。 在很久以前,就是這么做的,并且使用了很長的一段時間。此方法不是特別的方便,環(huán)境噪音提高了,必須得手動去調(diào)整閾值。

在嘗試中,我考慮了2種方法:

1. 人聲檢測 , 只有說話的時候才被打開,不說話關(guān)閉 。

2. RMS電平檢測。

DSP系統(tǒng)中,除了能實現(xiàn)模塊功能,另一個最重要的就是資源了。這個算法占用的CPU資源類不應(yīng)超過5%, 人聲檢測不能采用太過復(fù)雜的基于統(tǒng)計模型的算法,一個麥克風(fēng)需要檢測一次,共有32個麥克風(fēng),這將勢必不可取。后來嘗試了短時過零率和短時能量等方法。結(jié)果不太理想,應(yīng)該來說檢測結(jié)果不太理想,有時說話了確不出聲,一句話的前面幾個字像被吃掉了一樣。 總結(jié)來說,短時過零率等方法并不能準確判斷語音,第二個這類檢測方法都需要延時緩沖,大概10ms檢測數(shù)據(jù),吃字也是正常的。 被拋棄的想法就不細說了,有興趣的可以看看相關(guān)資料

采用RMS檢測方法, RMS我們都知道,就是均方根嘛。相對來說算法簡單易實現(xiàn), 根據(jù)過去一段時間的RMS值作為該麥克風(fēng)的參考噪聲閾值。這里面最重要的就是時間的選取,要反應(yīng)的是過去的噪聲水平,而不是有信號的狀態(tài)。語音信號屬于非平穩(wěn)信號,利用這一特點應(yīng)取最小值。記為瞬態(tài)RMS, N取值30ms對應(yīng)的采樣值。 T為噪聲閾值,等于過去的K幀RMS最小值, K值根據(jù)實際情況調(diào)節(jié)。

K 取值依據(jù),應(yīng)大于說話尾音所能持續(xù)的時間,正常說話一個字也就100多ms,字與字之間會出現(xiàn)停頓,噪聲閾值的依據(jù)也就是停頓期間的噪聲水平。說一個情況,同事在測試期間,一個字不停的拖尾音,喂……….,持續(xù)10幾秒。這種情況導(dǎo)致算法提高了噪聲閾值,剛開始可以導(dǎo)通,之后的喂出不了聲。 那么這個K值應(yīng)取得更大,K*30ms 需要大于最大能持續(xù)的時間才能檢測到空隙。

根據(jù)測試情況,RMS方法可以作為自適應(yīng)噪聲閾值判斷的方法。在測試中,會存在另外一種情況,一只麥克風(fēng)說話時,另一只麥克風(fēng)采集到了音箱擴聲的信號被打開。如果NOM Limit設(shè)置成1,只允許一個麥克風(fēng)打開。采集信號的麥克風(fēng)就會搶占說話的麥克風(fēng),引起兩個麥克風(fēng)互相切換。此時,應(yīng)調(diào)節(jié)2個參數(shù),一是保持時間,第二個靈敏度。

保持時間,停止說話后,該麥克風(fēng)保持多久才關(guān)閉,改時間要設(shè)置得比混響傳遞時間大一點。

靈敏度,實際上信號超過自適應(yīng)噪聲閾值+靈敏度才能判定為可以打開麥克風(fēng)。靈敏度需要設(shè)置高一點,即使有反饋也不會輕易打開話筒。

以上就是Gating自動混音的全部內(nèi)容,代碼就不貼了,也沒什么意義,關(guān)鍵還是思路吧。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 麥克風(fēng)
    +關(guān)注

    關(guān)注

    15

    文章

    619

    瀏覽量

    54614
  • 混音
    +關(guān)注

    關(guān)注

    0

    文章

    6

    瀏覽量

    7695
  • 混音器
    +關(guān)注

    關(guān)注

    2

    文章

    25

    瀏覽量

    12988

原文標題:Gating 自動混音(二)

文章出處:【微信號:ddongcloud,微信公眾號:嵌入式DSP】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    我們?yōu)槭裁匆?b class='flag-5'>自動混音技術(shù)?

    自動混音技術(shù)并不是一項新技術(shù),從上個世紀70年代開始涌現(xiàn)各種類型自動
    的頭像 發(fā)表于 06-22 08:43 ?7428次閱讀

    clock-gating的綜合實現(xiàn)

    在ASIC設(shè)計中,項目會期望設(shè)計將代碼寫成clk-gating風(fēng)格,以便于DC綜合時將寄存器綜合成clk-gating結(jié)構(gòu),其目的是為了降低翻轉(zhuǎn)功耗。
    的頭像 發(fā)表于 09-04 15:55 ?1649次閱讀
    clock-<b class='flag-5'>gating</b>的綜合實現(xiàn)

    淺析clock gating模塊電路結(jié)構(gòu)

    ICG(integrated latch clock gate)就是一個gating時鐘的模塊,通過使能信號能夠關(guān)閉時鐘。
    的頭像 發(fā)表于 09-11 12:24 ?1996次閱讀
    淺析clock <b class='flag-5'>gating</b>模塊電路結(jié)構(gòu)

    【6.2】技術(shù)解讀(框架、場景案例解讀

    `技術(shù)解讀(框架、場景案例解讀)`
    發(fā)表于 06-04 17:12

    基于2n3904晶體管2通道混音器電路圖

      該2通道混音器電路基于2n3904晶體管,該晶體管形成2個前置放大器。2通道混音器電路的第一
    發(fā)表于 08-01 17:19

    基于數(shù)字語音教室的多路混音算法及應(yīng)用Multi-Point

    在研究音頻混音技術(shù)的基礎(chǔ)上,結(jié)合基于嵌入式技術(shù)的數(shù)字語音教室的實際情況,提出了一種應(yīng)用于數(shù)字語音教室的多路實時混音算法,并給出了在數(shù)字語音教室中利用多路
    發(fā)表于 05-26 13:50 ?58次下載

    汽車落水自動開門開窗技術(shù)解讀

    汽車落水自動開門開窗技術(shù)解讀
    發(fā)表于 01-26 11:14 ?7次下載

    深度解讀智能公交如何實現(xiàn)車路云協(xié)同

    CIDI究竟是如何運用V2X技術(shù),做到車路云協(xié)同的呢?本文為大家?guī)鞢IDI V2X技術(shù)深度解讀
    的頭像 發(fā)表于 02-05 09:08 ?5710次閱讀

    調(diào)試混音?

    調(diào)試混音?
    發(fā)表于 05-15 14:31 ?2次下載
    調(diào)試<b class='flag-5'>混音</b>?

    50個典型電路實例深度解讀

    50個典型電路實例深度解讀
    發(fā)表于 02-07 11:47 ?0次下載

    構(gòu)建一個簡單的模擬音頻混音

    混頻器是一種特殊類型的電子電路,它結(jié)合了兩個信號(周期性重復(fù)的波形)。混音器在音頻和射頻系統(tǒng)中得到了廣泛應(yīng)用,很少用作簡單的模擬“計算機”。有兩種類型的模擬音頻混音器——加法
    的頭像 發(fā)表于 08-23 16:10 ?6324次閱讀
    構(gòu)建一個簡單的模擬音頻<b class='flag-5'>混音</b>器

    深度解讀智能汽車車載傳感器標定技術(shù)

    智能汽車是指集成了各種先進技術(shù)的智能化交通工具,它不僅具有駕駛輔助和自動駕駛功能,還能實現(xiàn)智能聯(lián)網(wǎng)、智能感知和智能互動等多種功能。而車載傳感器作為智能汽車的重要組成部分,其標定技術(shù)也顯得尤為重要。本文將
    的頭像 發(fā)表于 06-02 10:56 ?2167次閱讀

    低功耗設(shè)計基礎(chǔ):Clock Gating

    大多數(shù)低功耗設(shè)計手法在嚴格意義上說并不是由后端控制的,Clock Gating也不例外。
    的頭像 發(fā)表于 06-27 15:47 ?1575次閱讀
    低功耗設(shè)計基礎(chǔ):Clock <b class='flag-5'>Gating</b>

    AND GATE的clock gating check簡析

    一個cell的一個輸入為clock信號,另一個輸入為gating信號,并且輸出作為clock使用,這樣的cell為gating cell。
    的頭像 發(fā)表于 06-29 15:28 ?2719次閱讀
    AND GATE的clock <b class='flag-5'>gating</b> check簡析

    Clock Gating的特點、原理和初步實現(xiàn)

    當下這社會,沒有幾萬個Clock Gating,出門都不好意思和別人打招呼!
    的頭像 發(fā)表于 07-17 16:50 ?3791次閱讀
    Clock <b class='flag-5'>Gating</b>的特點、原理和初步實現(xiàn)