您好,歡迎來(lái)電子發(fā)燒友網(wǎng)! ,新用戶?[免費(fèi)注冊(cè)]

您的位置:電子發(fā)燒友網(wǎng)>電子百科>數(shù)碼產(chǎn)品>MP3播放器>

什么是數(shù)碼壓縮音頻格式

2010年02月02日 10:57 www.ttokpm.com 作者:佚名 用戶評(píng)論(0
關(guān)鍵字:

什么是數(shù)碼壓縮音頻格式

 日常生活中我們能接觸到很多聲音信息。而記錄這些信息的方法也是多種多樣。最常見(jiàn)的就是磁帶、CD、MD、MP3。當(dāng)然,還有其他比如LP、DVD-A等。這里主要介紹最為常見(jiàn)的MP3、MD和比較有對(duì)比性的APE格式。這三種格式都是數(shù)碼音頻格式,且都是壓縮格式。要了解這些數(shù)碼格式之前,我們還要了解什么是數(shù)碼信號(hào)。

  “數(shù)碼/數(shù)字”這兩個(gè)詞如今使用是越來(lái)越普遍了。感覺(jué)只要什么東西和這兩個(gè)詞粘上關(guān)系就屬于“高科技”了。其實(shí),所謂數(shù)碼最終形式只不過(guò)是“開關(guān)”而已。當(dāng)然,和家里電源的開關(guān)不是很一樣。數(shù)碼是一種“電子開關(guān)”。它最終只會(huì)包含兩種信息,一個(gè)是“0”一個(gè)是“1”。之所以能表現(xiàn)出復(fù)雜的各種形式,是因?yàn)椤半娮娱_關(guān)”的速度相當(dāng)驚人,每秒的“開關(guān)”(運(yùn)算)速度是極快的,這種速度遠(yuǎn)遠(yuǎn)高于人能夠分辨的程度。

  理解了數(shù)碼信號(hào)接下來(lái)理解一下“音頻數(shù)碼信號(hào)”。同樣的道理,數(shù)碼音頻信號(hào)的最終形式仍然是“0/1”構(gòu)成的。它們可能是任何排列和組合,比如“0001110101”或者“11100001010”。當(dāng)然,組合不同,其效果當(dāng)然就不一樣??吹竭@里,應(yīng)該有朋友注意到了。如果聲音是用“00101010”這樣的形式來(lái)記錄,那最終形態(tài)豈不就是一個(gè)“點(diǎn)”,也就是一個(gè)簡(jiǎn)單的“開關(guān)”過(guò)程而已。聲音是連續(xù)不斷的,怎么能用“點(diǎn)”來(lái)記錄呢?這樣我們聽到的聲音不就應(yīng)該是一段一段的嗎?道理不難理解。回家打開日光燈,你能發(fā)現(xiàn)日光燈在閃嗎?不能?其實(shí)日光燈的確是在不停閃爍的??催^(guò)動(dòng)畫片吧,那些都是用一格一格的靜止的圖畫連接成的。一格一格的圖畫我們也可以簡(jiǎn)單的理解為一個(gè)一個(gè)的“點(diǎn)”。人對(duì)自然界的感覺(jué)是有極限的,視覺(jué)和聽覺(jué)都是如此。動(dòng)畫片能產(chǎn)生連貫的動(dòng)作是因?yàn)檫@些“點(diǎn)”在人的視覺(jué)未能及時(shí)做出反映的情況下讓人產(chǎn)生的一種錯(cuò)覺(jué),除了機(jī)器,人是無(wú)法把這些“點(diǎn)”區(qū)分開的。聲音也是如此。如果聲音閃動(dòng)的頻率很快,人也是無(wú)法分辨的。另外,由于聲音在進(jìn)行“數(shù)字轉(zhuǎn)換模擬信號(hào)”(D/A轉(zhuǎn)換)的時(shí)候,解碼芯片已經(jīng)將這些“點(diǎn)”用連貫的串在一起了,所以我們聽到的是非常連貫的聲音了。

  要理解“數(shù)碼音頻”當(dāng)然必不可少還要理解兩個(gè)東西!

  1.速率。

  什么是速率?當(dāng)然我不能直接給你解釋說(shuō)“速率就是比特率”。呵呵,對(duì)于這樣的解釋還不如不說(shuō)的好。大家在用一些軟件播放聲音文件的時(shí)候應(yīng)該注意到了一個(gè)小小的信息。比如“128Kbps”、“1411Kbps”...也有朋友知道了,通常情況下,”Kbps”前面的數(shù)字越大,聲音效果越好。比如CD就是“1411Kbps"。那么,到底這些數(shù)字代表什么呢?簡(jiǎn)單的說(shuō)來(lái)就是在每秒鐘時(shí)間內(nèi),有多少數(shù)據(jù)被轉(zhuǎn)換成聲音。之所以CD的音質(zhì)比MP3好(別拿D版的CD來(lái)說(shuō)哦),是因?yàn)镃D在每一秒內(nèi)的信息比MP3多。比如,128Kbps的MP3文件相比1411Kbps的CD文件,其每秒被轉(zhuǎn)換的數(shù)據(jù)量,MP3比CD少了近12倍。同樣的一首歌曲,CD聽來(lái)就要細(xì)膩得多(當(dāng)然人群中有這么一群號(hào)稱“木耳”的人可能覺(jué)得效果是一樣的)MP3用較少的數(shù)據(jù)表達(dá)相同的內(nèi)容,其詳細(xì)程度當(dāng)然就不如CD了。這里可以把CD理解為一篇美文,而MP3就相當(dāng)于段落總結(jié)。兩者都能讓人理解其主要內(nèi)容,不過(guò)要想了解文章的美妙只看段落總結(jié)是不行的。至于MP3的原理后面會(huì)說(shuō)到。

  2.采樣率。

  采樣率也是很常見(jiàn)的一個(gè)詞語(yǔ)。具體表現(xiàn)形式為“XXHZ”,其中“XX”是一個(gè)具體數(shù)字。比如“44100HZ”,“32000HZ”等。采樣率這個(gè)詞從字面意思來(lái)理解應(yīng)該不難。之前已經(jīng)說(shuō)過(guò)了,數(shù)碼音頻文件是由很多個(gè)“點(diǎn)”來(lái)組成的,那么采樣率其實(shí)就是采集這些“點(diǎn)”的一個(gè)“數(shù)量”標(biāo)準(zhǔn)。很顯然“44100HZ”比“32000HZ”的采樣率要高,所以單位時(shí)間內(nèi)(1秒)搜集到的點(diǎn)就更多。單位時(shí)間的點(diǎn)越多聲音的信息也就越完善,當(dāng)然也就更接近于真實(shí)。所以,如果在保證速率相同的條件下,“44100HZ”的文件要好于“32000HZ”。(不是絕對(duì)的,原因后面會(huì)說(shuō)到)

  了解到以上“知識(shí)”之后,我們就可以進(jìn)一步來(lái)了解各種音頻格式了。這里,我不能把每一種格式都一一介紹。只取了幾個(gè)比較有代表性的格式來(lái)說(shuō)明一下。其中CD只是作為對(duì)比格式粗略說(shuō)明。

  CDDA(Compact Disc Digital Audio):

  不要變了一個(gè)稱呼就不知道這是什么格式了,這就是大家最熟悉的“CD”格式的全稱。說(shuō)到CD,種類有不少。最為常見(jiàn)的有“HDCD”(微軟)“SACD”(索尼)“XRCD”(JVC),不要被這些字母搞暈了??偟恼f(shuō)來(lái)就是“CD”,只是運(yùn)用的技術(shù)不同。有些需要專用的解碼器才能達(dá)到最優(yōu)質(zhì)的效果,這里就不多說(shuō)到底這些格式之間有哪些差異了。

  CD是大家最容易獲取到的音質(zhì)最好的音頻文件之一。通常CD采樣都是“44100HZ”而速率是“1411Kbps”。由于CD的精度已經(jīng)非常高,所以,我們稱這種格式為“無(wú)損音頻格式”。CD是由荷蘭“飛利普”和日本“索尼”共同制定的格式。

  MP3(MPEG Audio Layer-3):

  沒(méi)想到MP3的名字有這么長(zhǎng)吧~~

  1987年德國(guó)Fraunhofer研究院研制成功了一種有損壓縮音頻格式,1989年取得了專利。MP3剛出來(lái)并沒(méi)有引起人們的注意,在當(dāng)初年代,MP3可以說(shuō)是毫無(wú)競(jìng)爭(zhēng)力。因?yàn)樗旧頃?huì)對(duì)音頻文件造成過(guò)多的損壞,所以,當(dāng)時(shí)是不能被人們所接受的。那個(gè)時(shí)候的MP3技術(shù)也不成熟,聽MP3還不如買盤磁帶聽著舒服。直到后來(lái)網(wǎng)絡(luò)的發(fā)展,讓人們意識(shí)到MP3這種格式的方便性。于是MP3由于互聯(lián)網(wǎng)的關(guān)系迅速在全世界蔓延開了。如今已經(jīng)是家喻戶曉的東西了。

  早期的MP3都是固定速率編碼。后來(lái)格式進(jìn)一步改善,之后出現(xiàn)可變比特率。這種方式相比單純的固碼率要先進(jìn)得多。它能對(duì)聲音進(jìn)行進(jìn)一步的分析。能將聲音中某些需要加強(qiáng)的地方采用高速率編碼,而某些聲音簡(jiǎn)單一些的地方使用低速率編碼。這樣一來(lái),MP3文件在播放的時(shí)候速率就不固定了。這種做法既能節(jié)約有效空間又能達(dá)到更優(yōu)秀的音質(zhì)。

  MP3壓縮原理運(yùn)用到了“心理聲學(xué)數(shù)據(jù)儲(chǔ)存”。簡(jiǎn)單的說(shuō),就是丟棄一些人耳不易或者不能察覺(jué)到的信號(hào)。比如刪除超高頻和超低頻的聲音,保留主要的一些部分。也利用到了人耳的“屏蔽效應(yīng)”(簡(jiǎn)單的說(shuō)就是當(dāng)兩個(gè)聲音同時(shí)響起的時(shí)候,如果其中一個(gè)聲音音量大過(guò)另外一個(gè)聲音很多,那么另外一個(gè)聲音就會(huì)完全被第一個(gè)聲音所掩蓋,人就聽不到另外一個(gè)聲音了。比如在極其吵鬧的“的吧”,由于音響聲音非常大,所以用平時(shí)的聲音說(shuō)話根本就聽不見(jiàn)。另外,低頻的聲音比較容易屏蔽高頻聲音,而高頻聲音卻難屏蔽低頻),所以,MP3文件能在比CD小很多的情況下仍然有不錯(cuò)的音質(zhì)。

ATRAC:

  MD大家應(yīng)該多少都有一些了解,MD所用格式就是ATRAC。1991年,索尼開發(fā)出了ATRAC技術(shù)。同時(shí)采用了MD碟來(lái)儲(chǔ)存這種格式。從時(shí)間上來(lái)看,MP3的發(fā)展時(shí)間要比ATRAC要早,不過(guò)早期MP3并沒(méi)有得到人們的重視,所以發(fā)展較晚。

  MD被索尼定義為“隨時(shí)隨地享受音樂(lè)”。最初,索尼大勢(shì)宣傳ATRAC屬于“無(wú)損壓縮”。不過(guò),索尼的這一種做法遭到了無(wú)數(shù)“金耳朵”的指責(zé)。有相當(dāng)一部分人能夠聽出ATRAC與CD之間的差異。如今,索尼意識(shí)到群眾的耳朵是“金子”做的,于是,取消掉了這種說(shuō)法。

  ATRAC格式演變到現(xiàn)在已經(jīng)進(jìn)化了N次了。如今這種格式可以說(shuō)已經(jīng)比較成熟了。它的目的是在壓縮聲音文件的同時(shí)盡量取得更優(yōu)質(zhì)的音質(zhì)效果。其原理和MP3類似,不過(guò)算法比MP3更先進(jìn)。所以ATRAC在相同速率的情況下(默認(rèn)44100HZ采樣率)音質(zhì)優(yōu)于MP3。ATRAC格式屬于固定速率編碼。

APE:

  APE是Monkey's Audio提供的一種無(wú)損壓縮格式。這個(gè)才是真正意義上的無(wú)損格式。

  APE文件需要專用的播放軟件或者安裝有APE格式插件的播放器才能播放。對(duì)于APE的歷史我了解的不多。不過(guò)相信在之后的時(shí)間里,這種格式能被更多人所使用,其相關(guān)數(shù)據(jù)也會(huì)被更多人所了解。

  APE格式不同于MP3和ATRAC。它的目的并不是在壓縮的前提下盡量保證音質(zhì),而是絕對(duì)的完整的保證音質(zhì)。APE格式的壓縮比不大,如果采用最高壓縮則可以減小到原文件的3倍-4倍不等。同樣大的兩個(gè)聲音文件APE可能壓縮出來(lái)的大小不一樣。很簡(jiǎn)單的道理,APE并不是采用的固定速率進(jìn)行壓縮的。在回放APE文件的時(shí)候能很清楚的看到文件的速率是在不停的變化著的。由此可見(jiàn),可變速率的編碼方式在保證音質(zhì)方面是非常實(shí)用的技術(shù)。

有損與有損、有損與無(wú)損之間的差異:

  之前說(shuō)到了ATRAC的音質(zhì)在相同速率的條件下要好于MP3。為什么相同的速率相同的采樣率音質(zhì)卻不相同呢?這個(gè)當(dāng)然和文件本身的計(jì)算方式有直接的關(guān)系。MP3在很多人眼中有點(diǎn)“暴力”傾向。因?yàn)镸P3在壓縮過(guò)程中往往遺漏掉很多細(xì)節(jié),抓不住重點(diǎn)部分,對(duì)音質(zhì)影響很關(guān)鍵。

  大家知道,采樣率是用來(lái)采集點(diǎn)數(shù)量的標(biāo)準(zhǔn)。同是44100HZ的CD文件其速率是1411Kbps,而MP3可以減少到128Kbps(MP3標(biāo)準(zhǔn)格式)甚至更少。也就是說(shuō),MP3要在“點(diǎn)”的數(shù)量相同的條件下,用更少的信息去記錄這些點(diǎn)的關(guān)系。MP3為了減小文件體積,不得不從1411Kbps的信息當(dāng)中刪除1000多的信息量,而被刪除的這1000多的信息量當(dāng)中卻記錄著N個(gè)“點(diǎn)”。MP3刪除了這些信息也就意味著刪除了這些信息當(dāng)中的N個(gè)“點(diǎn)”。那么,MP3在回放的時(shí)候怎么還能以44100HZ的采樣率播放呢?這里運(yùn)用到的一個(gè)技術(shù)就是插值算法。

  舉一個(gè)簡(jiǎn)單的例子,假如聲音信號(hào)里面有1、2、3、4、5、6、7、8、9、0這10個(gè)點(diǎn)。如果MP3刪除了有關(guān)2、3、5、6、8、9的數(shù)據(jù),在回放的時(shí)候,為了保證還有這么多的“點(diǎn)”,就要插入一些數(shù)據(jù)來(lái)填充這些漏洞。所以,經(jīng)過(guò)MP3解碼之后得到的數(shù)據(jù)可能就是1、②、③、4、⑤、⑥、7、⑧、⑨、0。雖然“點(diǎn)”的數(shù)量還原了,不過(guò)丟失的點(diǎn)卻是“算”不回來(lái)的,只有靠相近的一些“點(diǎn)”來(lái)填補(bǔ)空缺。這樣的做法雖然保證了“點(diǎn)”的數(shù)量卻改變了“點(diǎn)”的一些性質(zhì),所以從根本上就對(duì)音質(zhì)起了破壞作用。

  之前提到ATRAC格式在相同速率的條件下其效果要優(yōu)于MP3。原理在于ATRAC格式比MP3格式更“聰明”一些。雖然壓縮的基本原理都差不多,不過(guò)ATRAC格式能更準(zhǔn)確的抓住重要的信息。ATRAC格式能更清楚的分辨哪些“點(diǎn)”是更重要的“點(diǎn)”,是需要保留的信息。

  同樣舉例說(shuō)明一下。假如有10個(gè)點(diǎn):1、2、3、4、5、6、7、8、9、0 其中2、4、6、8為相對(duì)重要的“點(diǎn)”。MP3結(jié)果則還是同上面一樣直接丟失2、3、5、6、8、9而得到1、②、③、4、⑤、⑥、7、⑧、⑨、0 的形式。ATRAC可能就完全不同,ATRAC能更多的抓住這些“點(diǎn)”。ATRAC還原出來(lái)的點(diǎn)就可能是①、2、③、④、5、⑥、⑦、8、⑨、0 由此可見(jiàn)ATRAC格式在刪除信息的時(shí)候能夠更多的保留一些重要信息。因此聲音的還原度比MP3高。實(shí)際聽感也是如此,如今132Kbps的ATRAC格式就已經(jīng)不比256Kbps的MP3格式音質(zhì)差,甚至還更好。(音質(zhì)問(wèn)題屬于主觀因素,這里只做參考)

  APE是一種比較優(yōu)秀的壓縮模式。它采用的技術(shù)與MP3和ATRAC完全不同。APE是真正意義上能做到“無(wú)損”的格式。要說(shuō)到APE的算法那就有點(diǎn)復(fù)雜了,非理科人材可能根本看不懂。如何去理解呢?其實(shí)這里有一個(gè)現(xiàn)成的例子!人人電腦上都應(yīng)該有的一個(gè)軟件“WIN RAR”,對(duì)于這個(gè)軟件大家并不陌生。這是一個(gè)文件壓縮軟件。它的目的是讓文件通過(guò)壓縮之后體積減小,而在解壓縮的時(shí)候能100%還原原文件信息。當(dāng)然,聲音文件也可以通過(guò)“WIN RAR”來(lái)壓縮。但是“WIN RAR”對(duì)聲音的壓縮比并不高。APE壓縮方式類似于“WIN RAR”,不同的是APE是專用做對(duì)聲音壓縮的格式。它能比“WIN RAR”更快而且壓縮比更高。

  做一個(gè)簡(jiǎn)單的實(shí)驗(yàn)。

  同樣的一個(gè)WAV(無(wú)損格式)文件,其所占容量是47.4MB。用“WIN RAR”最高壓縮后文件是25.5MB,而使用APE最高壓縮之后是15.6MB。雖然壓縮比不一樣,但是解壓縮之后所還原的WAV文件卻是和原文件一模一樣。(利用2進(jìn)制對(duì)比)這是保證音質(zhì)的關(guān)鍵。

  APE壓縮就好比家里的棉被又松又大不好收拾。疊好了裝進(jìn)塑料帶然后抽空里面的空氣可以減小很大一部分體積。而且絕對(duì)不會(huì)損壞棉被本身,還原后還是和之前一樣。MP3和ATRAC就好比把棉被里面的棉絮抽出來(lái)扔掉了,體積可以縮小到更小的程度。但是要用的時(shí)候由于扔掉的棉絮找不回來(lái)就只能隨便找些棉絮塞進(jìn)去。棉被還是棉被,表面上看好象還是那樣,但是根本早已改變。

  那么是否高速率(采樣率相同)的聲音文件就一定比低速率的要好呢?

  這一點(diǎn)是不確定的!速率只代表信息的多少并不能代表信息的正確性。就好比上面所說(shuō)ATRAC格式和MP3格式的差異一樣。另外再舉一個(gè)簡(jiǎn)單的例子。把一段64Kbps的MP3刻錄成CD,速率一下子就從64Kbps升到了1411Kbps。速率的確上去了,不過(guò)音質(zhì)卻只有64Kbps。原理很簡(jiǎn)單。64Kbps的MP3文件已經(jīng)把很多信息丟掉了,即便速率上去了但是彌補(bǔ)進(jìn)來(lái)的信息就猶如上面所說(shuō)的填棉絮的方法,和之前的信息已經(jīng)完全不同。這也是如今D版CD音質(zhì)下降的主要原因之一。如今D版CD有相當(dāng)多一部分都是直接用MP3轉(zhuǎn)過(guò)來(lái)的。音質(zhì)效果=MP3,這種D版是一種極其讓人討厭的東西,所以我有好久都沒(méi)買D版碟了。

  有關(guān)音頻文件的壓縮損耗也會(huì)造成速率相同音質(zhì)不同的現(xiàn)象。

  有損壓縮格式會(huì)在壓縮的時(shí)候丟失部分信息,所以應(yīng)該盡量減少壓縮次數(shù)。舉一個(gè)例子:

  CD轉(zhuǎn)MP3分兩種轉(zhuǎn)法。1.先把CD轉(zhuǎn)成320Kbps,然后轉(zhuǎn)成256Kbps,最后轉(zhuǎn)成128Kbps。2.直接把CD轉(zhuǎn)為128Kbps。如果你可以做這樣一個(gè)實(shí)驗(yàn),那通過(guò)第一種方式得到的文件其效果甚至不如96Kbps的文件。所以在壓縮文件的時(shí)候盡量做到一次到位,多次壓縮會(huì)使得數(shù)據(jù)丟失更加嚴(yán)重。

  看完以上內(nèi)容相信大家應(yīng)該對(duì)數(shù)碼音頻格式有一定的了解。對(duì)于文章中如果出現(xiàn)的不正確的比喻或者觀點(diǎn)還請(qǐng)各位提出來(lái)。

非常好我支持^.^

(0) 0%

不好我反對(duì)

(0) 0%

相關(guān)閱讀:

( 發(fā)表人:admin )

      發(fā)表評(píng)論

      用戶評(píng)論
      評(píng)價(jià):好評(píng)中評(píng)差評(píng)

      發(fā)表評(píng)論,獲取積分! 請(qǐng)遵守相關(guān)規(guī)定!

      ?