您好,歡迎來電子發(fā)燒友網(wǎng)! ,新用戶?[免費注冊]

您的位置:電子發(fā)燒友網(wǎng)>電子百科>數(shù)碼產(chǎn)品>MP3播放器>

MP3技術(shù)白皮書:音頻格式全解析

2010年02月02日 12:04 ttokpm.com 作者:佚名 用戶評論(0

MP3技術(shù)白皮書:音頻格式全解析

MP3的技術(shù)雖然現(xiàn)在已經(jīng)完全公開,但是,其具體的技術(shù)細節(jié)還是有一定的深度,因此此次小編對某些技術(shù)進行深度解釋,希望網(wǎng)友們笑納。


采樣率:

  數(shù)碼音頻系統(tǒng)是通過將聲波波形轉(zhuǎn)換成一連串的二進制數(shù)據(jù)來再現(xiàn)原始聲音的,實現(xiàn)這個步驟使用的設(shè)備是模/數(shù)轉(zhuǎn)換器(A/D)它以每秒上萬次的速率對聲波進行采樣,每一次采樣都記錄下了原始模擬聲波在某一時刻的狀態(tài),稱之為樣本。

  將一串的樣本連接起來,就可以描述一段聲波了,把每一秒鐘所采樣的數(shù)目稱為采樣頻率或采率,單位為HZ(赫茲)。采樣頻率越高所能描述的聲波頻率就越高。 對于每個采樣系統(tǒng)均會分配一定存儲位(bit數(shù))來表達聲波的聲波振幅狀態(tài),稱之為采樣分辯率或采樣精度,每增加一個bit,表達聲波振幅的狀態(tài)數(shù)就翻一翻,并且增加6db的動態(tài)范圍態(tài),即6db的動態(tài)范圍,一個2bit的數(shù)碼音頻系統(tǒng)表達千種狀態(tài),即12db的動態(tài)范圍,以此類推。如果繼續(xù)增加bit數(shù)則采樣精度就將以非??斓乃俣忍岣?,可以計算出16bit能夠表達65536種狀態(tài),對應(yīng),96db 而20bit可以表達1048576種狀態(tài),對應(yīng)120db。24bit可以表達多達16777216種狀態(tài)。對應(yīng)144db的動態(tài)范圍,采樣精度越高,聲波的還原就越細膩。(注:動態(tài)范圍是指聲音從最弱到最強的變化范圍)人耳的聽覺范圍通常是20HZ~20KHZ。

  根據(jù)奈魁斯特(NYQUIST)采樣定理,用兩倍于一個正弦波的頻繁率進行采樣就能完全真實地還原該波形,因此一個數(shù)碼錄音波的休樣頻率直接關(guān)系到它的最高還原頻率指標(biāo)例如,用44.1KHZ的采樣頻率進行采樣,則可還原最高為22.05KHZ的頻率-----這個值略高于人耳的聽覺極限,(注: 可錄MD,例R900的取樣頻率為44.1KHZ并且有取樣頻率轉(zhuǎn)換器,可將輸入的32KHz/44.1KHZ/48KHZ轉(zhuǎn)換為該機的標(biāo)準(zhǔn)取樣頻率44.1KHZ的還原頻率足已記示和真實再現(xiàn)世界上所有人再能辯的聲音了,所以CD音頻的采樣規(guī)格定義為16bit。44KHZ, 即使在最理想的環(huán)境下用現(xiàn)實生活中幾乎不可能制造的高精密電子元器件真實地實現(xiàn)了16bit的錄音,仍然會受到濾波和聲特定位等問題的困擾,人們還是能察覺出一些微小的失真所以很多專業(yè)數(shù)碼音頻系統(tǒng)已經(jīng)使用18bit甚至24bit 進行錄音和回放了。

現(xiàn)有的采樣方式:

  MP3:MP3的全稱應(yīng)為MPEG1 Layer-3音頻文件,MPEG(Moving Picture Experts Group)在漢語中譯為活動圖像專家組,特指活動影音壓縮標(biāo)準(zhǔn),MPEG音頻文件是MPEG1標(biāo)準(zhǔn)中的聲音部分,也叫MPEG音頻層,它根據(jù)壓縮質(zhì)量和編碼復(fù)雜程度劃分為三層,即Layer-1、Layer2、Layer3,且分別對應(yīng)MP1、MP2、MP3這三種聲音文件,并根據(jù)不同的用途,使用不同層次的編碼。MPEG音頻編碼的層次越高,編碼器越復(fù)雜,壓縮率也越高,MP1和MP2的壓縮率分別為4:1和6:1-8:1,而MP3的壓縮率則高達10:1-12:1,也就是說,一分鐘CD音質(zhì)的音樂,未經(jīng)壓縮需要10MB的存儲空間,而經(jīng)過MP3壓縮編碼后只有1MB左右。不過MP3對音頻信號采用的是有損壓縮方式,為了降低聲音失真度,MP3采取了“感官編碼技術(shù)”,即編碼時先對音頻文件進行頻譜分析,然后用過濾器濾掉噪音電平,接著通過量化的方式將剩下的每一位打散排列,最后形成具有較高壓縮比的MP3文件,并使壓縮后的文件在回放時能夠達到比較接近原音源的聲音效果。(另MP3PRO:mp3PRO編碼器將音頻的錄音分成兩個部分:mp3部分和PRO部分。mp3部分分析低頻段(Low Frequency Band)信息,并將其編碼成通常的mp3文件數(shù)據(jù)流。這就使得編碼器能夠集中編碼更少的有用信息,獲得更佳品質(zhì)的編碼效果。同時,這也保證了mp3PRO文件同老的mp3播放器的兼容性。PRO部分分析的則是高頻段(High Frequency Band)信息,并將其編碼成mp3數(shù)據(jù)流的一部分,而這些通常在老的mp3解碼器里是被忽略的。新的mp3PRO解碼器會有效地利用這部分數(shù)據(jù)流,將兩段(高頻段和低頻段)合并起來產(chǎn)生完全的音頻帶,達到增強音質(zhì)的效果。)

  WMA:WMA就是Windows Media Audio編碼后的文件格式,由微軟開發(fā),WMA針對的不是單機市場,是網(wǎng)絡(luò)!競爭對手就是網(wǎng)絡(luò)媒體市場中著名的Real Networks。微軟聲稱,在只有64kbps的碼率情況下,WMA可以達到接近CD的音質(zhì)。和以往的編碼不同,WMA支持防復(fù)制功能,她支持通過Windows Media Rights Manager 加入保護,可以限制播放時間和播放次數(shù)甚至于播放的機器等等。WMA支持流技術(shù),即一邊讀一邊播放,因此WMA可以很輕松的實現(xiàn)在線廣播,由于是微軟的杰作,因此,微軟在Windows中加入了對WMA的支持,WMA有著優(yōu)秀的技術(shù)特征,在微軟的大力推廣下,這種格式被越來越多的人所接受。

  WAV:這是一種古老的音頻文件格式,由微軟開發(fā)。WAV是一種文件格式,符合 PIFF Resource Interchange File Format規(guī)范。所有的WAV都有一個文件頭,這個文件頭音頻流的編碼參數(shù)。WAV對音頻流的編碼沒有硬性規(guī)定,除了PCM之外,還有幾乎所有支持ACM規(guī)范的編碼都可以為WAV的音頻流進行編碼。很多朋友沒有這個概念,我們拿AVI做個示范,因為AVI和WAV在文件結(jié)構(gòu)上是非常相似的,不過AVI多了一個視頻流而已。我們接觸到的AVI有很多種,因此我們經(jīng)常需要安裝一些Decode才能觀看一些AVI,我們接觸到比較多的DivX就是一種視頻編碼,AVI可以采用DivX編碼來壓縮視頻流,當(dāng)然也可以使用其他的編碼壓縮。同樣,WAV也可以使用多種音頻編碼來壓縮其音頻流,不過我們常見的都是音頻流被PCM編碼處理的WAV,但這不表示W(wǎng)AV只能使用PCM編碼,MP3編碼同樣也可以運用在WAV中,和AVI一樣,只要安裝好了相應(yīng)的Decode,就可以欣賞這些WAV了。在Windows平臺下,基于PCM編碼的WAV是被支持得最好的音頻格式,所有音頻軟件都能完美支持,由于本身可以達到較高的音質(zhì)的要求,因此,WAV也是音樂編輯創(chuàng)作的首選格式,適合保存音樂素材。因此,基于PCM編碼的WAV被作為了一種中介的格式,常常使用在其他編碼的相互轉(zhuǎn)換之中,例如MP3轉(zhuǎn)換成WMA。


  Ogg Vorbis :號稱MP3殺手!Ogg Vorbis究竟什么來頭呢?OGG是一個龐大的多媒體開發(fā)計劃的項目名稱,將涉及視頻音頻等方面的編碼開發(fā)。整個OGG項目計劃的目的就是向任何人提供完全免費多媒體編碼方案!OGG的信念就是:OPEN!FREE!Vorbis這個詞匯是特里·普拉特柴特的幻想小說《Small Gods》中的一個"花花公子"人物名。這個詞匯成為了OGG項目中音頻編碼的正式命名。目前Vorbis已經(jīng)開發(fā)成功,并且開發(fā)出了編碼器。Ogg Vorbis是高質(zhì)量的音頻編碼方案,官方數(shù)據(jù)顯示:Ogg Vorbis可以在相對較低的數(shù)據(jù)速率下實現(xiàn)比MP3更好的音質(zhì)!Ogg Vorbis這種編碼也遠比90年代開發(fā)成功的MP3先進,她可以支持多聲道,這意味著什么?這意味著Ogg Vorbis在SACD、DTSCD、DVD AUDIO抓軌軟件(目前這種軟件還沒有)的支持下,可以對所有的聲道進行編碼,而不是MP3只能編碼2個聲道。多聲道音樂的興起,給音樂欣賞帶來了革命性的變化,尤其在欣賞交響時,會帶來更多臨場感。這場革命性的變化是MP3無法適應(yīng)的。和MP3一樣,Ogg Vorbis是一種靈活開放的音頻編碼,能夠在編碼方案已經(jīng)固定下來后還能對音質(zhì)進行明顯的調(diào)節(jié)和新算法的改良。因此,它的聲音質(zhì)量將會越來越好,和MP3相似,Ogg Vorbis更像一個音頻編碼框架,可以不斷導(dǎo)入新技術(shù)逐步完善。和MP3一樣,OGG也支持VBR。

  RA:RA就是RealAudio格式,這是各位網(wǎng)蟲接觸得非常多的一種格式,大部分音樂網(wǎng)站的在線試聽都是采用了RealAudio,這種格式完全針對的就是網(wǎng)絡(luò)上的媒體市場,支持非常豐富的功能。最大的閃爍點就是這種格式可以根據(jù)聽眾的帶寬來控制自己的碼率,在保證流暢的前提下盡可能提高音質(zhì)。RA可以支持多種音頻編碼,包括ATRAC3。和WMA一樣,RA不但都支持邊讀邊放,也同樣支持使用特殊協(xié)議來隱匿文件的真實網(wǎng)絡(luò)地址,從而實現(xiàn)只在線播放而不提供下載的欣賞方式。這對唱片公司和唱片銷售公司很重要,在各方的大力推廣下,RA和WMA是目前互聯(lián)網(wǎng)上,用于在線試聽最多的音頻媒體格式。

  APE:APE是Monkey's Audio提供的一種無損壓縮格式。Monkey's Audio提供了Winamp的插件支持,因此這就意味著壓縮后的文件不再是單純的壓縮格式,而是和MP3一樣可以播放的音頻文件格式。這種格式的壓縮比遠低于其他格式,但能夠做到真正無損,因此獲得了不少發(fā)燒用戶的青睞。在現(xiàn)有不少無損壓縮方案種,APE是一種有著突出性能的格式,令人滿意的壓縮比以及飛快的壓縮速度,成為了不少朋友私下交流發(fā)燒音樂的唯一選擇。

  ACC:AAC(高級音頻編碼技術(shù),Advanced Audio Coding)是杜比實驗室為音樂社區(qū)提供的技術(shù)。AAC號稱「最大能容納48通道的音軌,采樣率達96 KHz,并且在320Kbps的數(shù)據(jù)速率下能為5.1聲道音樂節(jié)目提供相當(dāng)于ITU-R廣播的品質(zhì)」。和MP3比起來,它的音質(zhì)比較好,也能夠節(jié)省大約30%的儲存空間與帶寬。它是遵循MPEG-2的規(guī)格所開發(fā)的技術(shù)。

  ATRAC 3/ATRAC 3 plus:ATRAC3(AdaptiveTransformAcousticCoding3)由日本索尼公司開發(fā),是MD所采用的ATRAC的升級版,其壓縮率(約為ATRAC的2倍)和音質(zhì)均與MP3相當(dāng)。壓縮原理包括同時掩蔽、時效掩蔽和等響度曲線等,與MP3大致相同。ATRAC3的版權(quán)保護功能采用的是OpenMG。目前,對應(yīng)ATRAC3的便攜式播放機主要是索尼公司自己的產(chǎn)品。不過,該公司已于2000年2月與富士通、日立、NEC、Rohm、三洋和TI等半導(dǎo)體制造商簽署了制造并銷售ATRAC3用LSI的專利許可協(xié)議。

非常好我支持^.^

(0) 0%

不好我反對

(0) 0%

( 發(fā)表人:admin )

      發(fā)表評論

      用戶評論
      評價:好評中評差評

      發(fā)表評論,獲取積分! 請遵守相關(guān)規(guī)定!

      ?