音頻編碼原理
語音編碼致力于:降低傳輸所需要的信道帶寬,同時保持輸入語音的高質(zhì)量。
語音編碼的目標(biāo)在于:設(shè)計低復(fù)雜度的編碼器以盡可能低的比特率實現(xiàn)高品質(zhì)數(shù)據(jù)傳輸。
1、靜音閾值曲線:只在安靜環(huán)境下,人耳在各個頻率能聽到聲音的閾值。
2、臨界頻帶
由于人耳對不同頻率的解析度不同,MPEG1/Audio將22khz內(nèi)可感知的頻率范圍,依不同編碼層,不同取樣頻率,劃分成23~26個臨界頻帶。下圖列出理想臨界頻帶的中心頻率與頻寬。圖中可看到,人耳對低頻的解析度較好。
3、頻域上的掩蔽效應(yīng):幅值較大的信號會掩蔽頻率相近的幅值較小的信號,如下圖:
4、時域上的遮蔽效應(yīng):在一個很短的時間內(nèi),若出現(xiàn)了2個聲音,SPL(sound pressure level)較大的聲音會掩蔽SPL較小的聲音。時域掩蔽效應(yīng)分前向掩蔽(pre-masking)和后向掩蔽(post-masking),其中post-masking的時間會比較長,約是pre-masking的10倍。
時域遮蔽效應(yīng)有助于消除前回音。
-
音頻編碼
+關(guān)注
關(guān)注
0文章
35瀏覽量
12847
發(fā)布評論請先 登錄
相關(guān)推薦
評論