H.264(MPEG)-4AVC
版權(quán)聲明:本文為博主原創(chuàng)文章,遵循 CC 4.0 BY-SA 版權(quán)協(xié)議,轉(zhuǎn)載請附上原文出處鏈接和本聲明。
本文鏈接:https://blog.csdn.net/Tosonw/article/details/89251677
H.264或MPEG-4第10部分,高級視頻編碼(MPEG-4 AVC)是一種基于塊的運動補償視頻壓縮標準。截至2014年,它是錄制,壓縮和分發(fā)視頻內(nèi)容最常用的格式之一。1它支持分辨率高達8192×4320,包括8K UHD。2
H.264 / AVC項目的目的是創(chuàng)建一種標準,能夠以比以前標準低得多的比特率提供良好的視頻質(zhì)量(即,MPEG-2,H.263或MPEG-的比特率的一半或更低)。 4第2部分),沒有增加設(shè)計的復雜性,以至于實施起來不切實際或過于昂貴。另一個目標是提供足夠的靈活性,使標準能夠應(yīng)用于各種網(wǎng)絡(luò)和系統(tǒng)上的各種應(yīng)用,包括低和高比特率,低分辨率和高分辨率視頻,廣播,DVD存儲,RTP / IP分組網(wǎng)絡(luò)和ITU-T多媒體電話系統(tǒng)。 H.264標準可以被視為由許多不同的配置文件組成的“標準族”。特定解碼器解碼至少一個但不一定是所有簡檔。解碼器規(guī)范描述了可以解碼哪些配置文件。 H.264通常用于有損壓縮,盡管也可以在有損編碼圖像中創(chuàng)建真正的無損編碼區(qū)域,或者支持整個編碼無損的罕見用例。
H.264由ITU-T視頻編碼專家組(VCEG)與ISO / IEC JTC1運動圖像專家組(MPEG)一起開發(fā)。項目合作伙伴關(guān)系被稱為聯(lián)合視頻小組(JVT)。 ITU-T H.264標準和ISO / IEC MPEG-4 AVC標準(正式地,ISO / IEC 14496-10-MPEG-4 Part 10,高級視頻編碼)被共同維護,使得它們具有相同的技術(shù)內(nèi)容。關(guān)于第一版標準的最終起草工作于2003年5月完成,其后續(xù)版本中增加了其功能的各種擴展。高效視頻編碼(HEVC),即H.265和MPEG-H第2部分是由相同組織開發(fā)的H.264 / MPEG-4 AVC的后繼者,而早期標準仍然普遍使用。
最著名的H.264可能是藍光光盤的視頻編碼標準之一;所有藍光光盤播放器必須能夠解碼H.264。它也被流媒體互聯(lián)網(wǎng)資源廣泛使用,例如來自Vimeo,YouTube和iTunes Store的視頻,諸如Adobe Flash Player和Microsoft Silverlight等網(wǎng)絡(luò)軟件,以及地面上的各種HDTV廣播(ATSC,ISDB-T,DVB) -T或DVB-T2),電纜(DVB-C)和衛(wèi)星(DVB-S和DVB-S2)。
H.264受各方擁有的專利保護。涵蓋H.264所必需的大多數(shù)(但不是全部)專利的許可由專利池MPEG LA管理。3專利H.264技術(shù)的商業(yè)使用需要向MPEG LA和其他專利所有者支付版稅。 MPEG LA允許免費使用H.264技術(shù)為最終用戶免費提供流媒體互聯(lián)網(wǎng)視頻,思科系統(tǒng)公司代表其開源H.264編碼器二進制文件用戶向MPEG LA支付版稅。
命名
H.264名稱遵循ITU-T命名慣例,其中該標準是H.26x系列VCEG視頻編碼標準的成員; MPEG-4 AVC名稱與ISO / IEC MPEG中的命名約定有關(guān),其中該標準是ISO / IEC 14496的第10部分,ISO / IEC 14496是稱為MPEG-4的標準套件。該標準是在VCEG和MPEG的合作伙伴關(guān)系中共同開發(fā)的,之前在ITU-T開展了一項名為H.26L的VCEG項目。因此,通常使用諸如H.264 / AVC,AVC / H.264,H.264 / MPEG-4AVC或MPEG-4 / H.264 AVC之類的名稱來引用該標準以強調(diào)共同遺產(chǎn)。有時,它也被稱為“JVT編解碼器”,參考開發(fā)它的聯(lián)合視頻組(JVT)組織。 (這種伙伴關(guān)系和多種命名并不罕見。例如,稱為MPEG-2的視頻壓縮標準也源于MPEG和ITU-T之間的伙伴關(guān)系,其中MPEG-2視頻被ITU-T社區(qū)稱為H .262。4)某些軟件程序(如VLC媒體播放器)在內(nèi)部將此標準標識為AVC1。
歷史
1998年初,視頻編碼專家組(VCEG-ITU-T SG16 Q.6)發(fā)出了關(guān)于一個名為H.26L的項目的提案征集,其目標是將編碼效率提高一倍(這意味著將所需的比特率減半)與用于各種應(yīng)用的任何其他現(xiàn)有視頻編碼標準相比,給定的保真度水平。 VCEG由Gary Sullivan(微軟,前身為美國PictureTel)擔任主席。該新標準的初稿設(shè)計于1999年8月通過。2000年,Thomas Wiegand(德國海因里希赫茲研究所)成為VCEG聯(lián)合主席。
2001年12月,VCEG和運動圖像專家組(MPEG-ISO / IEC JTC 1 / SC 29 / WG 11)組成了一個聯(lián)合視頻組(JVT),其章程最終確定了視頻編碼標準。[5]該規(guī)范于2003年3月獲得正式批準.JVT由Gary Sullivan,Thomas Wiegand和Ajay Luthra(摩托羅拉,美國:后來的Arris,美國)擔任主席。 2004年6月,F(xiàn)idelity范圍擴展(FRExt)項目最終確定。從2005年1月到2007年11月,JVT正致力于通過名為可伸縮視頻編碼(SVC)的附件(G)將H.264 / AVC擴展到可擴展性。 JVT管理團隊由Jens-Rainer Ohm(德國亞琛大學)擴展。從2006年7月到2009年11月,JVT開展了多視頻視頻編碼(MVC),這是H.264 / AVC向免費視點電視和3D電視的擴展。這項工作包括開發(fā)兩個新的標準配置文件:Multiview High Profile和Stereo High Profile。
第一版H.264 / AVC的標準化于2003年5月完成。在第一個擴展原始標準的項目中,JVT隨后開發(fā)了所謂的Fidelity Range Extensions(FRExt)。這些擴展通過支持更高的采樣位深度精度和更高分辨率的顏色信息實現(xiàn)了更高質(zhì)量的視頻編碼,包括稱為Y’CbCr 4:2:2(= YUV 4:2:2)和Y’CbCr 4:4的采樣結(jié)構(gòu):4。 Fidelity Range Extensions項目中還包括其他一些功能,例如4×4和8×8整數(shù)變換之間的自適應(yīng)切換,編碼器指定的基于感知的量化加權(quán)矩陣,高效的圖片間無損編碼以及支持附加顏色空間。 Fidelity Range Extensions的設(shè)計工作于2004年7月完成,其起草工作于2004年9月完成。
最近該標準的進一步擴展包括添加五個其他新的配置文件[哪些?]主要用于專業(yè)應(yīng)用,增加擴展色域空間支持,定義額外的寬高比指標,定義另外兩種類型的“補充增強信息”(后過濾提示和色調(diào)映射),并棄用之前的FRExt配置文件之一(高4:4:4配置文件),行業(yè)反饋[由誰?]指示應(yīng)該設(shè)計不同。
標準中增加的下一個主要功能是可伸縮視頻編碼(SVC)。在H.264 / AVC的附件G中規(guī)定,SVC允許構(gòu)建包含也符合標準的子比特流的比特流,包括稱為“基本層”的一個這樣的比特流,其可以由H.264 /解碼不支持SVC的AVC編解碼器。對于時間比特流可縮放性(即,存在具有比主比特流更小的時間采樣率的子比特流),在導出子比特流時從比特流中移除完整的存取單元。在這種情況下,相應(yīng)地構(gòu)造比特流中的高級語法和幀間預測參考圖片。另一方面,對于空間和質(zhì)量比特流可伸縮性(即,存在具有比主比特流更低的空間分辨率/質(zhì)量的子比特流),在導出子比特流時從比特流中去除NAL(網(wǎng)絡(luò)抽象層)。 。在這種情況下,層間預測(即,從較低空間分辨率/質(zhì)量信號的數(shù)據(jù)預測較高空間分辨率/質(zhì)量信號)通常用于有效編碼??蓴U展視頻編碼擴展于2007年11月完成。
標準中添加的下一個主要功能是多視圖視頻編碼(MVC)。在H.264 / AVC的附錄H中規(guī)定,MVC使得能夠構(gòu)造表示視頻場景的多于一個視圖的比特流。該功能的一個重要示例是立體3D視頻編碼。在MVC工作中開發(fā)了兩個配置文件:Multiview High Profile支持任意數(shù)量的視圖,Stereo High Profile專為兩視圖立體視頻而設(shè)計。 Multiview視頻編碼擴展于2009年11月完成。
應(yīng)用
更多信息:使用H.264 / MPEG-4 AVC的視頻服務(wù)列表:https://en.wikipedia.org/wiki/List_of_video_services_using_H.264/MPEG-4_AVC
H.264視頻格式具有非常廣泛的應(yīng)用范圍,涵蓋從低比特率互聯(lián)網(wǎng)流媒體應(yīng)用到HDTV廣播和幾乎無損編碼的數(shù)字電影應(yīng)用的所有形式的數(shù)字壓縮視頻。通過使用H.264,與MPEG-2 Part 2相比,可以節(jié)省50%或更多的比特率。例如,據(jù)報道,H.264提供的數(shù)字衛(wèi)星電視質(zhì)量與目前的MPEG-2實現(xiàn)相同,比特率不到一半,目前的MPEG-2實現(xiàn)速率約為3.5 Mbit / s,H.264僅為1.5 Mbit / s的。[23]索尼聲稱9 Mbit / s AVC錄制模式相當于HDV格式的圖像質(zhì)量,其使用大約18-25 Mbit / s。[24]
為了確保H.264 / AVC的兼容性和無故障采用,許多標準組織已經(jīng)修改或添加到其視頻相關(guān)標準中,以便這些標準的用戶可以使用H.264 / AVC。藍光光盤格式和現(xiàn)已停產(chǎn)的HD DVD格式都將H.264 / AVC High Profile作為三種強制視頻壓縮格式之一。數(shù)字視頻廣播項目(DVB)于2004年底批準將H.264 / AVC用于廣播電視。
美國的高級電視系統(tǒng)委員會(ATSC)標準機構(gòu)于2008年7月批準了H.264 / AVC用于廣播電視,盡管該標準尚未用于美國境內(nèi)的固定ATSC廣播。[25] [ 26]它還被批準用于最新的ATSC-M / H(移動/手持)標準,使用H.264的AVC和SVC部分。[27]
CCTV(閉路電視)和視頻監(jiān)控市場已將該技術(shù)納入許多產(chǎn)品中。
許多常見的數(shù)碼單反相機使用包含在QuickTime MOV容器中的H.264視頻作為本機記錄格式。
派生格式
AVCHD是由Sony和Panasonic設(shè)計的高清錄制格式,使用H.264(符合H.264,同時添加其他特定于應(yīng)用程序的功能和約束)。
AVC-Intra是由Panasonic開發(fā)的僅幀內(nèi)壓縮格式。
XAVC是Sony設(shè)計的錄制格式,使用H.264 / MPEG-4 AVC的5.2級,這是該視頻標準支持的最高級別。[28] [29] XAVC可支持4K分辨率(4096×2160和3840×2160),速度高達每秒60幀(fps)。[28] [29]索尼宣布支持XAVC的相機包括兩款CineAlta相機 - 索尼PMW-F55和索尼PMW-F5。[30]索尼PMW-F55可記錄XAVC,4K分辨率為30 fps,速度為300 Mbit / s,2K分辨率,30 fps,100 Mbit / s。[31] XAVC可以以60 fps的速度記錄4K分辨率,并以600 Mbit / s的速度進行4:2:2色度子采樣。[32] [33]
派生格式
AVCHD是由Sony和Panasonic設(shè)計的高清錄制格式,使用H.264(符合H.264,同時添加其他特定于應(yīng)用程序的功能和約束)。
AVC-Intra是由Panasonic開發(fā)的僅幀內(nèi)壓縮格式。
XAVC是Sony設(shè)計的錄制格式,使用H.264 / MPEG-4 AVC的5.2級,這是該視頻標準支持的最高級別。[28] [29] XAVC可支持4K分辨率(4096×2160和3840×2160),速度高達每秒60幀(fps)。[28] [29] 索尼宣布支持XAVC的相機包括兩款CineAlta相機 - 索尼PMW-F55和索尼PMW-F5。[30] 索尼PMW-F55可記錄XAVC,4K分辨率為30 fps,速度為300 Mbit / s,2K分辨率,30 fps,100 Mbit / s。[31] XAVC可以以60 fps的速度記錄4K分辨率,并以600 Mbit / s的速度進行4:2:2色度子采樣。[32] [33]
設(shè)計
本文采用列表格式,可以使用散文更好地呈現(xiàn)。 如果合適,您可以將此文章轉(zhuǎn)換為散文。 編輯幫助可用。 (2016年4月)
特征
H.264的框圖
https://upload.wikimedia.org/wikipedia/commons/8/82/H.264_block_diagram_with_quality_score.jpg
H.264 / AVC / MPEG-4第10部分包含許多新功能,使其能夠比舊標準更有效地壓縮視頻,并為各種網(wǎng)絡(luò)環(huán)境的應(yīng)用提供更大的靈活性。 特別是,一些這樣的關(guān)鍵功能包括:
多畫面畫面間預測包括以下特征:
以比以前的標準更靈活的方式使用先前編碼的圖片作為參考,在一些情況下允許使用多達16個參考幀(或者在隔行編碼的情況下為32個參考字段)。在支持非IDR幀的配置文件中,大多數(shù)級別指定應(yīng)該有足夠的緩沖以允許在最大分辨率下至少4或5個參考幀。這與現(xiàn)有標準形成對比,現(xiàn)有標準的限制通常為1;或者,在傳統(tǒng)的“B圖像”(B幀)的情況下,兩個。這個特殊功能通常允許在大多數(shù)場景中適度改進比特率和質(zhì)量。[引證需要]但在某些類型的場景中,例如具有重復動作或來回切換場景或未覆蓋背景區(qū)域的場景,它允許顯著在保持清晰度的同時降低比特率。
可變塊大小運動補償(VBSMC),塊大小為16×16,小至4×4,可實現(xiàn)移動區(qū)域的精確分割。支持的亮度預測塊大小包括16×16,16×8,8×16,8×8,8×4,4×8和4×4,其中許多可以在單個宏塊中一起使用。根據(jù)使用中的色度子采樣,色度預測塊大小相應(yīng)地更小。
在由16個4×4分區(qū)構(gòu)成的B宏塊的情況下,每個宏塊使用多個運動矢量(每個分區(qū)一個或兩個)的能力最大為32。每個8×8或更大的分區(qū)區(qū)域的運動矢量可以指向不同的參考圖像。
能夠在B幀中使用任何宏塊類型,包括I-宏塊,從而在使用B幀時產(chǎn)生更有效的編碼。從MPEG-4 ASP中可以看出這一特性。
用于推導半像素亮度樣本預測的六抽頭濾波,用于更清晰的子像素運動補償。通過半色值的線性插值導出四分之一像素運動,以節(jié)省處理能力。
用于運動補償?shù)乃姆种幌袼鼐?,可精確描述移動區(qū)域的位移。對于色度,分辨率通常在垂直和水平方向上減半(見4:2:0),因此色度的運動補償使用八分之一色度像素網(wǎng)格單元。
加權(quán)預測,允許編碼器在執(zhí)行運動補償時指定縮放和偏移的使用,并在特殊情況下提供性能的顯著優(yōu)勢 - 例如淡入淡出,淡入淡入和淡入淡出過渡。這包括對B幀的隱式加權(quán)預測,以及對P幀的顯式加權(quán)預測。
用于“幀內(nèi)”編碼的相鄰塊邊緣的空間預測,而不是MPEG-2第2部分中發(fā)現(xiàn)的“DC”預測和H.263v2和MPEG-4第2部分中的變換系數(shù)預測:
這包括亮度預測塊大小為16×16,8×8和4×4(其中每個宏塊中只能使用一種類型)。
無損宏塊編碼功能包括:
無損“PCM宏塊”表示模式,其中直接表示視頻數(shù)據(jù)樣本,[34]允許特定區(qū)域的完美表示,并允許對每個宏塊的編碼數(shù)據(jù)量進行嚴格限制。
增強的無損宏塊表示模式允許特定區(qū)域的完美表示,同時通常使用比PCM模式少得多的比特。
靈活的隔行掃描視頻編碼功能,包括:
宏塊自適應(yīng)幀場(MBAFF)編碼,對編碼為幀的圖像使用宏塊對結(jié)構(gòu),允許場模式下的16×16宏塊(與MPEG-2相比,其中場圖模式處理在圖像中被編碼為幀導致處理16×8半宏塊)。
圖像自適應(yīng)幀場編碼(PAFF或PicAFF)允許自由選擇的圖像混合編碼為完整幀,其中兩個場被組合在一起用于編碼或作為單獨的單個場。
新的轉(zhuǎn)換設(shè)計功能,包括:
精確匹配整數(shù)4×4空間塊變換,允許精確放置殘留信號,幾乎沒有先前編解碼器設(shè)計中常見的“振鈴”。這種設(shè)計在概念上類似于眾所周知的離散余弦變換(DCT),由N. Ahmed,T.Natarajan和K.R.Rao于1974年引入,它是離散余弦變換中的引用1。但是,它被簡化并提供精確指定的解碼。
精確匹配整數(shù)8×8空間塊變換,允許比4×4變換更高效地壓縮高度相關(guān)的區(qū)域。該設(shè)計在概念上類似于眾所周知的DCT,但是被簡化并且被提供以提供精確指定的解碼。
用于整數(shù)變換操作的4×4和8×8變換塊大小之間的自適應(yīng)編碼器選擇。
對應(yīng)用于色度DC系數(shù)(以及在一種特殊情況下也是亮度)的主空間變換的“DC”系數(shù)執(zhí)行二次Hadamard變換,以在平滑區(qū)域中獲得甚至更多的壓縮。
量化設(shè)計包括:
對數(shù)步長控制,通過編碼器更簡單的比特率管理和簡化的逆量化縮放
由編碼器選擇的頻率定制的量化縮放矩陣用于基于感知的量化優(yōu)化
環(huán)路去塊濾波器,有助于防止其他基于DCT的圖像壓縮技術(shù)常見的塊效應(yīng),從而獲得更好的視覺外觀和壓縮效率
熵編碼設(shè)計包括:
上下文自適應(yīng)二進制算術(shù)編碼(CABAC),一種在給定上下文中知道語法元素的概率的無損壓縮視頻流中的語法元素的算法。 CABAC比CAVLC更有效地壓縮數(shù)據(jù),但需要更多的處理才能解碼。
上下文自適應(yīng)可變長度編碼(CAVLC),其是用于編碼量化變換系數(shù)值的CABAC的較低復雜度的替代。雖然復雜性低于CABAC,但CAVLC比通常用于編碼其他現(xiàn)有設(shè)計中的系數(shù)的方法更精細且更有效。
用于許多未由CABAC或CAVLC編碼的語法元素的常見簡單且高度結(jié)構(gòu)化的可變長度編碼(VLC)技術(shù),稱為指數(shù)哥倫布編碼(或Exp-Golomb)。
損失恢復功能包括:
網(wǎng)絡(luò)抽象層(NAL)定義允許在許多網(wǎng)絡(luò)環(huán)境中使用相同的視頻語法。 H.264的一個非?;镜脑O(shè)計概念是生成自包含數(shù)據(jù)包,以刪除標題重復,如MPEG-4的標頭擴展代碼(HEC)。[35]這是通過從媒體流中解耦與多個切片相關(guān)的信息來實現(xiàn)的。高級參數(shù)的組合稱為參數(shù)集。[35] H.264規(guī)范包括兩種類型的參數(shù)集:序列參數(shù)集(SPS)和圖片參數(shù)集(PPS)。有效序列參數(shù)集在整個編碼視頻序列中保持不變,并且有效圖像參數(shù)集在編碼圖像內(nèi)保持不變。序列和圖像參數(shù)集結(jié)構(gòu)包含諸如圖像大小,采用的可選編碼模式和宏塊到切片組映射之類的信息。[35]
靈活宏塊排序(FMO),也稱為切片組,以及任意切片排序(ASO),其是用于重構(gòu)圖片中的基本區(qū)域(宏塊)的表示的排序的技術(shù)。通常被認為是錯誤/丟失穩(wěn)健性功能,F(xiàn)MO和ASO也可用于其他目的。
數(shù)據(jù)分區(qū)(DP),一種能夠?qū)⒏匾筒惶匾恼Z法元素分成不同數(shù)據(jù)包的功能,可以應(yīng)用不等錯誤保護(UEP)和其他類型的錯誤/丟失魯棒性改進。
冗余切片(RS),一種錯誤/丟失魯棒性特征,它允許編碼器發(fā)送圖像區(qū)域的額外表示(通常以較低保真度),如果主表示被破壞或丟失,則可以使用該表示。
幀編號,允許創(chuàng)建“子序列”的功能,通過在其他圖片之間可選地包含額外圖片來實現(xiàn)時間可伸縮性,以及檢測和隱藏整個圖片的丟失,這可能由于網(wǎng)絡(luò)數(shù)據(jù)包丟失或信道而發(fā)生錯誤。
切換片,稱為SP和SI片,允許編碼器指示解碼器跳轉(zhuǎn)到正在進行的視頻流,用于諸如視頻流比特率切換和“特技模式”操作之類的目的。當解碼器使用SP / SI功能跳轉(zhuǎn)到視頻流的中間時,它可以獲得與視頻流中該位置處的解碼圖像的精確匹配,盡管使用不同的圖片或根本沒有圖片,作為之前的參考。開關(guān)。
一種簡單的自動過程,用于防止意外模擬起始碼,起始碼是編碼數(shù)據(jù)中的特殊比特序列,允許隨機訪問比特流并恢復可能丟失字節(jié)同步的系統(tǒng)中的字節(jié)對齊。
補充增強信息(SEI)和視頻可用性信息(VUI),它們是可以插入比特流的額外信息,以增強視頻用于各種目的。[需要澄清] SEI FPA(幀封裝安排)包含3D排列的消息:
0:?checkerboard:?pixels?are?alternatively?from?L?and?R. 1:?column?alternation:?L?and?R?are?interlaced?by?column. 2:?row?alternation:?L?and?R?are?interlaced?by?row. 3:?side?by?side:?L?is?on?the?left,?R?on?the?right. 4:?top?bottom:?L?is?on?top,?R?on?bottom. 5:?frame?alternation:?one?view?per?frame.123456
輔助圖片,可用于alpha合成等目的。
支持單色(4:0:0),4:2:0,4:2:2和4:4:4色度子采樣(取決于所選的配置文件)。
支持采樣位深度精度,范圍為每個采樣8到14位(取決于所選的配置文件)。
能夠?qū)⒏鱾€顏色平面編碼為具有自己的切片結(jié)構(gòu),宏塊模式,運動矢量等的不同圖像,從而允許使用簡單的并行化結(jié)構(gòu)設(shè)計編碼器(僅支持三個支持4:4:4的配置文件) 。
圖像順序計數(shù),用于保持圖像的排序和與定時信息隔離的解碼圖像中的樣本值的特征,允許系統(tǒng)單獨地攜帶和控制/改變定時信息,而不影響解碼圖像內(nèi)容。
這些技術(shù)以及其他幾種技術(shù)有助于H.264在各種應(yīng)用環(huán)境中在各種情況下比任何先前的標準表現(xiàn)得更好。 H.264通??梢员萂PEG-2視頻更好地執(zhí)行 - 通常在比特率的一半或更低的情況下獲得相同的質(zhì)量,特別是在高比特率和高分辨率情況下。[36]
與其他ISO / IEC MPEG視頻標準一樣,H.264 / AVC具有可以免費下載的參考軟件實現(xiàn)。[37]其主要目的是提供H.264 / AVC功能的示例,而不是本身有用的應(yīng)用程序。運動圖像專家組也在進行一些參考硬件設(shè)計工作。上述是H.264 / AVC的完整特征,涵蓋了H.264的所有配置文件。編解碼器的配置文件是該編解碼器的一組特征,其被識別以滿足預期應(yīng)用的某些規(guī)范集。這意味著某些配置文件不支持列出的許多功能。下一節(jié)將討論H.264 / AVC的各種配置文件。
Feature support in particular profiles
級別
當該術(shù)語在標準中使用時,“級別”是指定的一組約束,其指示簡檔所需的解碼器性能的程度。 例如,配置文件內(nèi)的支持級別指定解碼器可以使用的最大圖像分辨率,幀速率和比特率。 符合給定級別的解碼器必須能夠解碼為該級別和所有較低級別編碼的所有比特流。
Levels with maximum property values[22]
High Profile的最大比特率是Constrained Baseline,Baseline,Extended和Main Profiles的1.25倍; Hi10P為3倍,Hi422P / Hi444PP為4倍。
亮度樣本的數(shù)量是宏塊數(shù)量的16×16 = 256倍(并且每秒亮度樣本的數(shù)量是每秒宏塊數(shù)量的256倍)。
解碼圖片緩沖
H.264 / AVC編碼器使用先前編碼的圖片來提供其他圖片中的樣本值的預測。這允許編碼器對編碼給定圖像的最佳方式做出有效決策。在解碼器處,這些圖片存儲在虛擬解碼圖片緩沖器(DPB)中。 DPB的最大容量,以幀(或字段對)為單位,如上表右欄中的括號所示,可以按如下方式計算:
DpbCapacity = min(floor(MaxDpbMbs /(PicWidthInMbs * FrameHeightInMbs)),16)
其中MaxDpbMbs是下表中提供的常量值作為級別編號的函數(shù),而PicWidthInMbs和FrameHeightInMbs是編碼視頻數(shù)據(jù)的圖片寬度和幀高度,以宏塊為單位表示(四舍五入為整數(shù)值并計算裁剪)和宏塊配對(如適用))。該公式在2017年版標準的A.3.1.h和A.3.2.f節(jié)中規(guī)定。[22]
Hardware
另請參閱:具有板載視頻流編碼和H.264 / MPEG-4 AVC產(chǎn)品和實現(xiàn)的攝像機列表
由于H.264編碼和解碼在特定類型的算術(shù)運算中需要大量計算能力,因此在通用CPU上運行的軟件實現(xiàn)通常功耗較低。但是,最新的四核通用x86 CPU具有足夠的計算能力來執(zhí)行實時SD和HD編碼。壓縮效率取決于視頻算法實現(xiàn),而不取決于是否使用硬件或軟件實現(xiàn)。因此,基于硬件和軟件的實現(xiàn)之間的差異更多地取決于功率效率,靈活性和成本。為了提高功率效率并降低硬件形狀因數(shù),可以采用專用硬件,用于完整的編碼或解碼過程,或用于CPU控制環(huán)境內(nèi)的加速輔助。
已知基于CPU的解決方案更加靈活,特別是當編碼必須以多種格式,多比特率和分辨率(多屏幕視頻)同時進行時,并且可能具有容器格式支持,高級集成廣告功能等的附加功能?;贑PU的軟件解決方案通常可以更容易地在同一CPU內(nèi)對多個并發(fā)編碼會話進行負載均衡。
2011年1月CES(消費電子展)上推出的第二代英特爾“Sandy Bridge”Core i3 / i5 / i7處理器提供片上硬件全高清H.264編碼器,稱為英特爾快速同步視頻。[54] [ 55]
具有H.264編碼器功能的ASIC編碼器可從許多不同的半導體公司獲得,但ASIC中使用的核心設(shè)計通常是從Chips&Media,Allegro DVT,On2(以前的Hantro,被Google收購)等少數(shù)公司中獲得許可, Imagination Technologies,NGCodec。一些公司同時擁有FPGA和ASIC產(chǎn)品。[56]
德州儀器(TI)生產(chǎn)一系列ARM + DSP內(nèi)核,以30fps的速度執(zhí)行1080p的DSP H.264 BP編碼。[57]這允許編解碼器(其被實現(xiàn)為高度優(yōu)化的DSP代碼)的靈活性,同時比通用CPU上的軟件更有效。
許可
另請參閱:Microsoft Corp.訴Motorola Inc.和Qualcomm Inc.訴Broadcom Corp.
在維護軟件算法專利的國家,使用H.264 / AVC的產(chǎn)品的供應(yīng)商和商業(yè)用戶預計將為其產(chǎn)品使用的專利技術(shù)支付專利許可使用費。[58]這也適用于基線概況。[59]
一個名為MPEG LA的私人組織,與MPEG標準化組織無任何關(guān)聯(lián),管理適用于該標準的專利許可,以及MPEG-2第1部分系統(tǒng)的專利池,MPEG-2第2部分視頻,MPEG-4第2部分視頻,HEVC,MPEG-DASH和其他技術(shù)。美國的MPEG LA H.264專利至少持續(xù)到2027年。[60]
2010年8月26日,MPEG LA宣布,對終端用戶免費的H.264編碼互聯(lián)網(wǎng)視頻將永遠不會收取版稅。[61]所有其他特許權(quán)使用費仍然存在,例如對H.264視頻進行解碼和編碼的產(chǎn)品的版稅以及免費電視和訂閱頻道的運營商。[62]許可條款以5年為塊更新。[63]
法律專利的實際狀態(tài)在2018年底到期,共有123頁。 [64]
2005年,美國專利5,452,104和美國專利5,576,767的受讓人高通公司在美國地方法院起訴Broadcom,聲稱Broadcom通過制造符合H.264視頻壓縮標準的產(chǎn)品侵犯了這兩項專利。[65] 2007年,地區(qū)法院認定專利無法執(zhí)行,因為高通公司在2003年5月發(fā)布H.264標準之前未能向JVT披露這些專利。[65] 2008年12月,美國聯(lián)邦巡回上訴法院確認了地區(qū)法院關(guān)于專利無法執(zhí)行的命令,但向地區(qū)法院提出了指示,要求將不可執(zhí)行的范圍限制在符合H.264標準的產(chǎn)品范圍內(nèi)。[65]
External links
ITU-T?publication?page:?H.264:?Advanced?video?coding?for?generic?audiovisual?services MPEG-4?AVC/H.264?Information?Doom9's?Forum H.264/MPEG-4?Part?10?Tutorials?(Richardson) "Part?10:?Advanced?Video?Coding".?ISO?publication?page:?ISO/IEC?14496-10:2010?–?Information?technology?—?Coding?of?audio-visual?objects. "H.264/AVC?JM?Reference?Software".?IP?Homepage.?Retrieved?2007-04-15. "JVT?document?archive?site".?Retrieved?2007-05-06. "Publications".?Thomas?Wiegand.?Retrieved?2007-06-23. "Publications".?Detlev?Marpe.?Retrieved?2007-04-15. "Fourth?Annual?H.264?video?codecs?comparison".?Moscow?State?University.?(dated?December?2007) "Discussion?on?H.264?with?respect?to?IP?cameras?in?use?within?the?security?and?surveillance?industries".?(dated?April?2009) "Sixth?Annual?H.264?video?codecs?comparison".?Moscow?State?University.?(dated?May?2010)1234567891011
原文鏈接:https://en.wikipedia.org/wiki/H.264/MPEG-4_AVC
版權(quán)聲明:本文為博主原創(chuàng)文章,遵循 CC 4.0 BY-SA 版權(quán)協(xié)議,轉(zhuǎn)載請附上原文出處鏈接和本聲明。
本文鏈接:https://blog.csdn.net/Tosonw/article/details/89251677
評論
查看更多