0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

音頻編碼的分類

工程師 ? 來源:網(wǎng)絡(luò)整理 ? 作者:h1654155205.5246 ? 2018-11-08 15:52 ? 次閱讀

音頻編碼的分類

根據(jù)編碼方式的不同,音頻編碼技術(shù)分為三種:波形編碼、參數(shù)編碼和混合編碼。一般來說,波形編碼的話音質(zhì)量高,但編碼速率也很高;參數(shù)編碼的編碼速率很低,產(chǎn)生的合成語音的音質(zhì)不高;混合編碼使用參數(shù)編碼技術(shù)和波形編碼技術(shù),編碼速率和音質(zhì)介于它們之間。

1、波形編碼

波形編碼是指不利用生成音頻信號的任何參數(shù),直接將時間域信號變換為數(shù)字代碼,使重構(gòu)的語音波形盡可能地與原始語音信號的波形形狀保持一致。波形編碼的基本原理是在時間軸上對模擬語音信號按一定的速率抽樣,然后將幅度樣本分層量化,并用代碼表示。

波形編碼方法簡單、易于實現(xiàn)、適應(yīng)能力強(qiáng)并且語音質(zhì)量好。不過因為壓縮方法簡單也帶來了一些問題:壓縮比相對較低,需要較高的編碼速率。一般來說,波形編碼的復(fù)雜程度比較低,編碼速率較高、通常在16 kbit/s以上,質(zhì)量相當(dāng)高。但編碼速率低于16 kbit/s時,音質(zhì)會急劇下降。

最簡單的波形編碼方法是PCM(Pulse Code Modulation,脈沖編碼調(diào)制),它只對語音信號進(jìn)行采樣和量化處理。優(yōu)點是編碼方法簡單,延遲時間短,音質(zhì)高,重構(gòu)的語音信號與原始語音信號幾乎沒有差別。不足之處是編碼速率比較高(64 kbit/s),對傳輸通道的錯誤比較敏感。

2、參數(shù)編碼

參數(shù)編碼是從語音波形信號中提取生成語音的參數(shù),使用這些參數(shù)通過語音生成模型重構(gòu)出語音,使重構(gòu)的語音信號盡可能地保持原始語音信號的語意。也就是說,參數(shù)編碼是把語音信號產(chǎn)生的數(shù)字模型作為基礎(chǔ),然后求出數(shù)字模型的模型參數(shù),再按照這些參數(shù)還原數(shù)字模型,進(jìn)而合成語音。

參數(shù)編碼的編碼速率較低,可以達(dá)到2.4 kbit/s,產(chǎn)生的語音信號是通過建立的數(shù)字模型還原出來的,因此重構(gòu)的語音信號波形與原始語音信號的波形可能會存在較大的區(qū)別、失真會比較大。而且因為受到語音生成模型的限制,增加數(shù)據(jù)速率也無法提高合成語音的質(zhì)量。不過,雖然參數(shù)編碼的音質(zhì)比較低,但是保密性很好,一直被應(yīng)用在軍事上。典型的參數(shù)編碼方法為LPCLinear Predictive Coding,線性預(yù)測編碼)。

3、混合編碼

混合編碼是指同時使用兩種或兩種以上的編碼方法進(jìn)行編碼。這種編碼方法克服了波形編碼和參數(shù)編碼的弱點,并結(jié)合了波形編碼高質(zhì)量和參數(shù)編碼的低編碼速率,能夠取得比較好的效果。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 音頻編碼
    +關(guān)注

    關(guān)注

    0

    文章

    33

    瀏覽量

    12819
收藏 人收藏

    評論

    相關(guān)推薦

    音頻信號的無損壓縮編碼是什么

    音頻信號的無損壓縮編碼是一種在不損失音頻質(zhì)量的前提下,減少音頻文件大小的技術(shù)。這種技術(shù)對于存儲和傳輸音頻數(shù)據(jù)非常有用,尤其是在帶寬有限或存儲
    的頭像 發(fā)表于 09-25 14:10 ?49次閱讀

    音頻數(shù)據(jù)的pcm編碼后還原過程的失真是由于

    音頻數(shù)據(jù)的PCM(Pulse Code Modulation,脈沖編碼調(diào)制)編碼后還原過程的失真主要是由于 量化誤差 造成的。PCM編碼過程主要包括三個步驟:采樣、量化和
    的頭像 發(fā)表于 09-25 14:07 ?53次閱讀

    音頻數(shù)據(jù)的pcm編碼過程

    PCM(脈沖編碼調(diào)制)是一種將模擬信號轉(zhuǎn)換為數(shù)字信號的編碼技術(shù),廣泛應(yīng)用于音頻、視頻和通信領(lǐng)域。在音頻領(lǐng)域,PCM編碼是將模擬
    的頭像 發(fā)表于 09-25 11:35 ?68次閱讀

    Pcm音頻用什么解碼

    PCM(脈沖編碼調(diào)制)音頻是一種非常常見的音頻編碼格式,它是一種未壓縮的音頻數(shù)據(jù)格式,廣泛應(yīng)用于各種音頻
    的頭像 發(fā)表于 09-25 11:34 ?58次閱讀

    Pcm音頻解碼后是什么信號

    PCM(Pulse Code Modulation,脈沖編碼調(diào)制)是一種將模擬信號轉(zhuǎn)換為數(shù)字信號的編碼方式。在音頻處理中,PCM音頻解碼是將數(shù)字音頻
    的頭像 發(fā)表于 09-25 11:29 ?62次閱讀

    編碼器有什么分類?

    編碼器本質(zhì)是一種用于運動控制的傳感器,作用在于測量機(jī)械旋轉(zhuǎn)的位移。
    的頭像 發(fā)表于 08-10 14:47 ?301次閱讀

    使用提供的esp_audio_codec 的庫組件時,不能將AAC音頻解碼回PCM音頻,為什么?

    使用提供的esp_audio_codec 的庫組件時,能夠?qū)CM音頻編碼為AAC音頻,但是不能將AAC音頻解碼回PCM音頻,是為什么導(dǎo)致的
    發(fā)表于 06-05 06:39

    音頻信號處理電路的特征 影碟機(jī)中的音頻信號處理電路詳解

    音頻信號處理電路是專門設(shè)計來處理音頻信號的電子電路,它們可以用于放大、濾波、調(diào)制、解調(diào)、編碼、解碼等多種用途。
    的頭像 發(fā)表于 05-01 15:46 ?1053次閱讀
    <b class='flag-5'>音頻</b>信號處理電路的特征 影碟機(jī)中的<b class='flag-5'>音頻</b>信號處理電路詳解

    C6000教學(xué)實驗箱_嵌入式操作教程_音頻編碼:3-7 G711A音頻編碼實驗

    一、實驗?zāi)康?學(xué)習(xí)G711音頻的格式和G711A音頻編碼的原理,并實現(xiàn)將PCM格式編碼為BIT格式。 二、實驗原理 G711 G711是國際電信聯(lián)盟訂定出來的一套語音壓縮標(biāo)準(zhǔn),主要用于
    發(fā)表于 04-18 16:15

    嵌入式操作教程_數(shù)字信號處理_音頻編解碼:3-6 AAC音頻解碼實驗

    、有損音樂壓縮格式、有損語音壓縮格式和合成算法。本實驗中使用的AAC格式屬于有損音樂壓縮格式。音頻編解碼的目的是減少傳輸?shù)男畔⒘亢蜏p少儲存的信息。 音頻的編解碼的格式分類 無壓縮的格式(PCM,WAV
    發(fā)表于 04-11 09:22

    基于FPGA的TMDS編碼

    音頻或視頻信號,接下來就著重了解一下TMDS編碼。 TMDS(最小化傳輸差分信號)中,有四個通道,其中包含了三個數(shù)據(jù)通道和一個時鐘通道。其中數(shù)據(jù)通道用來傳輸顏色、音頻、控制等信號。HDMI默認(rèn)
    發(fā)表于 04-09 15:45

    數(shù)字信號處理實驗操作教程:3-3 mp3音頻編碼實驗(AD7606采集)

    一、實驗?zāi)康?學(xué)習(xí)AD7606采集音頻數(shù)據(jù)的方法并掌握MP3音頻編碼的原理,并實現(xiàn)AD7606采集音頻數(shù)據(jù)進(jìn)行MP3編碼并保存到SD卡。 二
    發(fā)表于 04-03 16:41

    常見的視覺編碼器有哪些 圖像編碼和視覺編碼的區(qū)別

    視覺編碼器是一種能夠處理視頻理解任務(wù)的模型,它能夠通過單一凍結(jié)模型,處理各種視頻理解任務(wù),包括分類、本地化、檢索、字幕和問答等。
    的頭像 發(fā)表于 02-26 14:24 ?1481次閱讀

    音頻TRS接口是什么?TRS接口的2種分類 trs接口和rca接口的區(qū)別

    音頻TRS接口是什么?TRS接口的2種分類 trs接口和rca接口的區(qū)別? 音頻TRS接口是指一種用于傳輸音頻信號的接口,它由3個導(dǎo)體組成,分別是左聲道、右聲道和地線。TRS是“Tip
    的頭像 發(fā)表于 11-28 14:34 ?7893次閱讀

    AADAU1861: 三個ADC、一個發(fā)援會、帶音頻DSP數(shù)據(jù)表的低功率編碼器 ADI

    電子發(fā)燒友網(wǎng)為你提供ADI(ADI)AADAU1861: 三個ADC、一個發(fā)援會、帶音頻DSP數(shù)據(jù)表的低功率編碼器相關(guān)產(chǎn)品參數(shù)、數(shù)據(jù)手冊,更有AADAU1861: 三個ADC、一個發(fā)援會、帶音頻
    發(fā)表于 10-11 18:34
    AADAU1861: 三個ADC、一個發(fā)援會、帶<b class='flag-5'>音頻</b>DSP數(shù)據(jù)表的低功率<b class='flag-5'>編碼</b>器 ADI