办公室熟妇人妻久久精品,yy4438无码亚洲成a人片,亚洲国产精品无码久久久高潮

Part 01●概述●

在實時音視頻通信場景，麥克風采集用戶語音的同時會采集大量環(huán)境噪聲，傳統(tǒng)降噪算法僅對平穩(wěn)噪聲（如電扇風聲、白噪聲、電路底噪等）有一定效果，對非平穩(wěn)的瞬態(tài)噪聲（如餐廳嘈雜噪聲、地鐵環(huán)境噪聲、家庭廚房噪聲等）降噪效果較差，嚴重影響用戶的通話體驗。針對泛家庭、辦公等復雜場景中的上百種非平穩(wěn)噪聲問題，融合通信系統(tǒng)部生態(tài)賦能團隊自主研發(fā)基于GRU模型的AI 音頻降噪技術，并通過算法和工程優(yōu)化，將降噪模型尺寸從2.4MB壓縮至82KB，運行內(nèi)存降低約65%；計算復雜度從約186Mflops優(yōu)化至42Mflops,運行效率提升77%；在現(xiàn)有的測試數(shù)據(jù)集中（實驗環(huán)境下），可有效分離人聲和噪聲，將通話語音質量Mos分（平均意見值）提升至4.25。

Part 02●噪聲分類和降噪算法選擇●

實時音視頻的應用場景中，設備處于復雜的聲學環(huán)境，麥克風采集語音信號的同時還會采集大量噪聲，對實時音視頻質量來說是一個非常大的挑戰(zhàn)。噪聲的種類是多種多樣的。根據(jù)噪聲的數(shù)學統(tǒng)計特性可以將噪聲分為兩類：

平穩(wěn)噪聲：噪聲的統(tǒng)計特性在比較長的時間里不會隨時間而變化，比如白噪聲、電風扇、空調(diào)、車內(nèi)噪聲等；

非平穩(wěn)噪聲：噪聲的統(tǒng)計特性隨時間在變化，如餐廳嘈雜噪聲、地鐵站、辦公室、家庭廚房等。

在實時音視頻應用中，通話易受到各類噪聲干擾從而影響體驗，因此實時音頻降噪已經(jīng)成為實時音視頻中的一個重要功能。對于平穩(wěn)的噪聲，比如空調(diào)出風口呼呼聲或者錄制設備的底噪，它不會隨著時間變化而產(chǎn)生較大變化，可以將其估計預測出來，通過簡單的減法的方式把它去掉，常見的有譜減法、維納濾波以及小波變換。對于非平穩(wěn)噪聲，例如馬路上車子呼嘯而過的聲音、餐廳內(nèi)餐盤的撞擊聲、家庭廚房內(nèi)的鍋具的敲擊聲，都是隨機突發(fā)出現(xiàn)，是不可能通過估計預測的方式去解決的。傳統(tǒng)算法對于非平穩(wěn)噪聲難以估計和消除，這也是我們采用深度學習算法的原因。

Part 03●深度學習降噪算法設計●

為了提高音頻SDK對于各種噪聲場景的降噪能力，彌補傳統(tǒng)降噪算法的不足，我們研發(fā)了基于RNN的AI降噪模塊，結合傳統(tǒng)降噪技術和深度學習技術。重點針對家庭和辦公室使用場景的降噪處理，在噪聲數(shù)據(jù)集中加入大量的室內(nèi)噪聲類型，諸如辦公室內(nèi)的鍵盤敲擊、辦公桌與辦公用品拖拉的摩擦聲、座椅拖動、家庭中的廚房嘈雜聲、地板撞擊聲等等。

與此同時，為了在移動端的實時語音處理落地，該AI音頻降噪算法將計算開銷和庫的尺寸控制在一個非常低的量級。在計算開銷上，以48KHz為例，每幀語音的RNN網(wǎng)絡處理處理僅需約17.5Mflops，F(xiàn)FT和IFFT每幀語音需要約7.5Mflops，特征提取需要約12Mflops，總計約42Mflops，計算復雜度約和48KHz的Opus編解碼相當，在某品牌中端手機型號，統(tǒng)計RNN降噪模塊CPU占用約為4%。在音頻庫的尺寸上，開啟RNN降噪編譯后，音頻引擎庫的體積僅僅增加約108kB。

Part 04●網(wǎng)絡模型及處理流程●

該模塊采用RNN 模型，原因是 RNN 相比其他學習模型（例如 CNN）攜帶時間信息，可以對時序信號進行建模，而不僅僅是單獨的音頻輸入和輸出幀。同時，模型采用門控循環(huán)單元（GRU，如圖1所示），實驗表明，GRU在語音降噪任務上的性能略好于LSTM，并且由于GRU的權值參數(shù)更少，可以節(jié)省計算資源。與簡單的循環(huán)單元相比，GRU有兩個額外的門。重置門控制狀態(tài)是否用于計算新狀態(tài)，而更新門控制狀態(tài)將根據(jù)新輸入改變的程度。這個更新門使GRU可以長時間記憶時序信息，這也是GRU比簡單的循環(huán)單元表現(xiàn)更好的原因。

圖1 左側為簡單循環(huán)單元，右側為GRU

模型的結構如圖2所示。訓練后的模型會被嵌入到音視頻通信 SDK 中，通過讀取硬件設備的音頻流，對音頻流進行分幀處理并送入 AI 降噪預處理模塊中，預處理模塊會將對應的特征（Feature）計算出來，并輸出到訓練好的模型中，通過模型計算出對應的增益（Gain）值，使用增益值對信號進行調(diào)整，最終達到降噪的目的（如圖3所示）。

圖 2. 基于GRU的RNN網(wǎng)絡模型

圖3. 上方為模型訓練流程，下方為實時降噪流程

Part 05●AI降噪處理效果和落地●

圖4為帶有鍵盤敲擊噪聲的降噪前后語音語譜圖的對比，上半部分為降噪前的帶噪語音信號，其中紅色矩形框內(nèi)為鍵盤敲擊噪聲。下半部分為降噪后的語音信號，通過觀測可以發(fā)現(xiàn)，絕大部分鍵盤敲擊聲均可以被抑制，同時語音損傷控制在較低的程度。

圖4. 帶噪語音（通話過程伴隨著鍵盤敲擊聲）降噪前后對比

目前的AI降噪模型，已經(jīng)在手機端和家親上線，改善手機端和家親APP通話降噪效果，對泛家庭、辦公室等100多種噪聲場景具備優(yōu)秀的抑制能力，同時保持語音不失真。下一階段，將將持續(xù)優(yōu)化AI降噪模型的計算復雜度，以在IoT低功耗設備上能夠推廣使用。

審核編輯：陳陳

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用，如有內(nèi)容侵權或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

AI

AI

+關注

關注
87

文章
29824

瀏覽量
268112
降噪技術

降噪技術

+關注

關注
2

文章
44

瀏覽量
12732
實時通信

實時通信

+關注

關注
0

文章
18

瀏覽量
9698

原文標題：技術趣談 | 實時通信中的AI降噪技術

文章出處：【微信號：5G通信，微信公眾號：5G通信】歡迎添加關注！文章轉載請注明出處。

NanoEdge AI的技術原理、應用場景及優(yōu)勢

NanoEdge AI 是一種基于邊緣計算的人工智能技術，旨在將人工智能算法應用于物聯(lián)網(wǎng)（IoT）設備和傳感器。這種技術的核心思想是將數(shù)據(jù)處理和分析從云端轉移到設備本身，從而減少數(shù)據(jù)傳

發(fā)表于 03-12 08:09

全國高技術重點圖書·通信技術領域_現(xiàn)代通信中的排隊論

全國高技術重點圖書·通信技術領域_現(xiàn)代通信中的排隊論

發(fā)表于 08-18 20:32

labview通信中如果有通信協(xié)議，如何處理通信中傳輸?shù)膮f(xié)議數(shù)據(jù)？

我要接受的數(shù)據(jù)在一個數(shù)據(jù)包中，通信中數(shù)據(jù)包一位一位的傳輸，我現(xiàn)在想將通信的過程中（實時）將數(shù)據(jù)包分別提取出來，該如何實現(xiàn)？

發(fā)表于 04-11 15:31

PROFINET及其同步實時通信分析

PROFINET是一種新的實時以太網(wǎng)標準，本文介紹了PROFINET兩類不同性能的實時通信的技術特點，并對等時同步實時

發(fā)表于 02-21 15:24 ?12次下載

PROFINET及其同步實時通信分析

PROFINET是一種新的實時以太網(wǎng)標準，本文介紹了PROFINET兩類不同性能的實時通信的技術特點，并對等時同步實時

發(fā)表于 07-22 17:32 ?14次下載

MIMO技術在對流層散射通信中的性能分析

介紹了MIMO技術的基本原理,分析了MIMO系統(tǒng)的模型以及信道容量。運用Matlab/Simulink對MIMO技術在散射通信中的性能進行了仿真。仿真結果表明,應用MIMO

發(fā)表于 11-03 15:20 ?23次下載

McWiLL系統(tǒng)在應急通信中的應用分析

McWiLL系統(tǒng)在應急通信中的應用分析

發(fā)表于 11-10 17:52 ?18次下載

McWiLL系統(tǒng)在應急<b class='flag-5'>通信中</b>的應用<b class='flag-5'>分析</b>

網(wǎng)絡通信中差錯控制技術的應用與研究

網(wǎng)絡通信中差錯控制技術的應用與研究，網(wǎng)絡通信的技術資料，很好很實用。

發(fā)表于 03-28 10:11 ?18次下載

藍牙技術在遠程電力線通信中的應用下載

藍牙技術在遠程電力線通信中的應用下載

發(fā)表于 09-01 11:02 ?3次下載

藍牙<b class='flag-5'>技術</b>在遠程電力線<b class='flag-5'>通信中</b>的應用下載

高速DSP技術及其在通信中的應用

高速DSP技術及其在通信中的應用

發(fā)表于 10-20 08:45 ?14次下載

高速DSP<b class='flag-5'>技術</b>及其在<b class='flag-5'>通信中</b>的應用

基于DSP的語音降噪系統(tǒng)設計方案解析

在現(xiàn)實的語音通信中會不可避免地受到來自環(huán)境中的背景噪聲影響，致使通信質量嚴重下降，甚至聽不清楚對方講話的內(nèi)容，因此對帶噪語音信號進行降噪已經(jīng)成為語音通信中的一個非常迫切的課題。近年來，

發(fā)表于 10-31 11:52 ?15次下載

基于DSP的語音<b class='flag-5'>降噪</b>系統(tǒng)設計方案解析

無線通信中的MIMO技術

無線通信中的MIMO技術免費下載。

發(fā)表于 06-15 17:00 ?16次下載

光纖通信技術在電力通信中的應用

電力通信中的光纖通信技術，光波效率高，傳輸?shù)娜萘糠浅４?，?b class='flag-5'>通信傳輸?shù)倪^程中，提升了運行效率。光纖通信技術

發(fā)表于 04-19 15:25 ?1415次閱讀

PROFINET實時工業(yè)以太網(wǎng)通信技術分析

電子發(fā)燒友網(wǎng)站提供《PROFINET實時工業(yè)以太網(wǎng)通信技術分析.pdf》資料免費下載

發(fā)表于 11-03 11:42 ?5次下載

光通信及光纖通信中的光譜分析

光通信及光纖通信中的光譜分析? 光通信及光纖通信是一種用于傳輸數(shù)據(jù)的重要技術。在光

發(fā)表于 01-19 10:32 ?1262次閱讀

搜索歷史

實時通信中的AI降噪技術分析

評論

NanoEdge AI的技術原理、應用場景及優(yōu)勢

全國高技術重點圖書·通信技術領域_現(xiàn)代通信中的排隊論

labview通信中如果有通信協(xié)議，如何處理通信中傳輸?shù)膮f(xié)議數(shù)據(jù)？

PROFINET及其同步實時通信分析

PROFINET及其同步實時通信分析

MIMO技術在對流層散射通信中的性能分析

McWiLL系統(tǒng)在應急通信中的應用分析

網(wǎng)絡通信中差錯控制技術的應用與研究

藍牙技術在遠程電力線通信中的應用下載

高速DSP技術及其在通信中的應用

基于DSP的語音降噪系統(tǒng)設計方案解析

無線通信中的MIMO技術

光纖通信技術在電力通信中的應用

PROFINET實時工業(yè)以太網(wǎng)通信技術分析

光通信及光纖通信中的光譜分析