0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

馬思偉:視頻領(lǐng)域如大海一般無所不包

LiveVideoStack ? 作者:工程師譚軍 ? 2018-08-05 10:31 ? 次閱讀

6月,在北京大學(xué)理科2號樓一間辦公室內(nèi)見到了北京大學(xué)信息科學(xué)技術(shù)學(xué)院教授馬思偉,并相約這次郵件采訪。作為國產(chǎn)編解碼器AVS視頻組的組長,馬思偉暢談了編碼器的格局,AVS的機會以及學(xué)習(xí)編解碼的經(jīng)驗及方法。

LiveVideoStack:馬思偉您好,請簡要介紹下自己,以及目前主要的工作方向,對哪些技術(shù)或領(lǐng)域感興趣?

馬思偉:大家好,我是馬思偉,主要從事視頻編碼方面的研究,按照視頻編碼標(biāo)準(zhǔn)的定義區(qū)分,主要從事兩大類編碼技術(shù)的研究:一類是視頻編碼標(biāo)準(zhǔn)范疇內(nèi)的技術(shù),需要在標(biāo)準(zhǔn)規(guī)范中給以嚴(yán)格定義描述的技術(shù),如預(yù)測、變換等一些核心技術(shù)模塊。另一類是標(biāo)準(zhǔn)之外,面向編碼器優(yōu)化實現(xiàn)的前后處理相關(guān)技術(shù),如去噪聲、質(zhì)量增強等視頻處理技術(shù)。

LiveVideoStack:許多開發(fā)者都有體會,做音視頻的“坑”比較多,入門不易做好更難。對于有意愿進(jìn)入這一領(lǐng)域的初學(xué)者,您有哪些經(jīng)驗可以分享的?

馬思偉:入門不易,貴在堅持。由淺入深,循序漸進(jìn)。比如最開始從簡單了解視頻應(yīng)用層面的一些技術(shù)點入手,可以讀科普性質(zhì)的文章、博文等先了解個大概,然后根據(jù)應(yīng)用需求學(xué)習(xí)密切相關(guān)的一個或幾個模塊,可以讀些專題文章,再后才是逐步更全面的學(xué)習(xí),或者某一模塊的深入鉆研,具體學(xué)到什么程度可以按需分配精力來學(xué),不要眉毛胡子一把抓,不分主次,不要囫圇吞棗,貪多爵不爛,于事無宜。

LiveVideoStack:什么樣的編解碼器是一個好的編解碼器?視頻質(zhì)量、碼率、算法復(fù)雜度、對數(shù)據(jù)丟失或錯誤的魯棒性等。當(dāng)下對于編解碼器的研發(fā),業(yè)界主要的研究方向是什么?其難點是什么?

馬思偉:好無止境,沒有最好,只有更好,但翻過來只要能在一定時期滿足一定應(yīng)用需求的不妨都稱為好的編解碼器。諸如質(zhì)量、碼率、復(fù)雜度、容錯等等這些因素,好的編解碼器是要尋求在這些約束之下能夠滿足應(yīng)用需求的最佳折中,是動態(tài)變化不斷提升的,同時這也是編解碼器研發(fā)的難點。

LiveVideoStack:大家已經(jīng)開始研究H.266、AV1以及國產(chǎn)的AVS2/AVS3,他們有哪些特點?各自的優(yōu)勢應(yīng)用場景是什么?

馬思偉:標(biāo)準(zhǔn)一般是在設(shè)計上盡量覆蓋需求比較相近的多個應(yīng)用場景,但實際上不同應(yīng)用場景之間總還是存在一些特定的差異,對技術(shù)的選擇也有很大的影響,這時標(biāo)準(zhǔn)一般通過設(shè)置不同的檔次來為某一類應(yīng)用場景提供特定的工具支持。像目前這些視頻編碼標(biāo)準(zhǔn),都還是比較通用的,廣播、通訊等各行業(yè)都可以在其基礎(chǔ)上開發(fā)出好的編解碼器進(jìn)行應(yīng)用,當(dāng)然實際應(yīng)用情況也是多種因素影響,比如還有專利授權(quán)政策問題對應(yīng)用有著很大的影響,不是由單單技術(shù)這一項因素所決定的。

LiveVideoStack:因為有Google、Netflix等巨頭的支持,AV1備受關(guān)注。國內(nèi)一些大視頻平臺也在和AOM談判考慮加入。目前看,H.264的應(yīng)用還處于統(tǒng)治地位,HEVC因為專利風(fēng)險,正在面臨來自AV1的挑戰(zhàn),再加上國產(chǎn)的AVS系列。您如何看待未來Codec戰(zhàn)爭以及市場格局的走勢?

馬思偉:很多實際案例已經(jīng)告知我們多元化是好事兒,有利于技術(shù)競爭,產(chǎn)業(yè)發(fā)展,希望未來格局是多些國內(nèi)的創(chuàng)新領(lǐng)導(dǎo)者。

LiveVideoStack:能否介紹下AVS系列的技術(shù)演進(jìn)狀態(tài),編碼效率、算法復(fù)雜度、延遲,生態(tài)的成熟度,包括硬件方案的成熟度,尤其是移動設(shè)備的硬件方案,商業(yè)編解碼器/解碼器方案等。

馬思偉:AVS從2002年至今制定了一系列的視頻編碼標(biāo)準(zhǔn),即我們常說的AVS1、AVS+、AVS2,每一個標(biāo)準(zhǔn)制定實際上都是一個大工程,對于每項技術(shù)都要進(jìn)行詳細(xì)全面的評估,目前AVS+、AVS2在廣電行業(yè)的成功應(yīng)用已經(jīng)充分證明AVS標(biāo)準(zhǔn)技術(shù)是成熟的,更多的商業(yè)方案及應(yīng)用有待于市場的進(jìn)一步培育而協(xié)同發(fā)展。

LiveVideoStack:比如騰訊推出的TPG圖片格式采用了AVS2作為引擎,AVS在工業(yè)界的已經(jīng)有哪些應(yīng)用落地?未來AVS的主要應(yīng)用場景是什么?

馬思偉:騰訊推出TPG是AVS歷史上具有里程碑意義的事件之一,是騰訊音視頻實驗室團隊勇于創(chuàng)新的體現(xiàn)。目前AVS2 4K超高清廣播、IPTV點播等應(yīng)用也已落地或正在落地,和TPG一樣,未來有多少勇于創(chuàng)新者,AVS就會有多少應(yīng)用場景。

LiveVideoStack:對于應(yīng)屆生或從其他研發(fā)領(lǐng)域轉(zhuǎn)行學(xué)習(xí)編解碼、多媒體開發(fā)的技術(shù)人,有哪些建議?

馬思偉:視頻領(lǐng)域是個海洋,可以游泳、沖浪,也可以潛水、遠(yuǎn)航,根據(jù)自身的基礎(chǔ)、特長和興趣選擇合適的領(lǐng)域涉足,編碼優(yōu)化、去噪聲、視覺特效等很多問題都是跨領(lǐng)域的,涉及計算機、電子、通信,甚至藝術(shù)、生理、心理學(xué)等,無論本專業(yè)還是外專業(yè)都需要再學(xué)習(xí),相信來者有益。

LiveVideoStack:能否推薦一些系統(tǒng)學(xué)習(xí)編解碼、多媒體開發(fā)的圖書、資料

馬思偉:快速了解某一標(biāo)準(zhǔn)可以看標(biāo)準(zhǔn)文本、關(guān)于標(biāo)準(zhǔn)的專著,如畢厚杰老師的《新一代視頻編碼標(biāo)準(zhǔn)——H.264/AVC》,萬帥、楊付正老師的《新一代高效視頻編碼H.265HEVC原理、標(biāo)準(zhǔn)與實現(xiàn)》,Mathias Wien的《High Efficiency Video Coding: Coding Tools and Specification》,Vivienne Sze等主編的《High Efficiency Video Coding(HEVC) Algorithms and Architectures》 ;深入學(xué)習(xí)編碼理論和技術(shù),可以學(xué)習(xí)經(jīng)典的教材,如Yunqing Shi和 Huifang Sun老師的《Image and Video Compression for Multimedia Engineering, Fundamentals, Algorithms and Standards》,Yao Wang, J?rn Ostermann和Ya-Qin Zhang的《Video Processing and Communications》,我也合作出版過一本《數(shù)字視頻編碼技術(shù)原理》供學(xué)習(xí)參考;再進(jìn)一步若關(guān)注于某一項技術(shù)的研究,則需要對相關(guān)論文進(jìn)行梳理,深入閱讀。

LiveVideoStack:5G商用,4K逐漸流行。 您如何看他們給多媒體生態(tài)帶來的機會?對于Codec有哪些機會和挑戰(zhàn)?

馬思偉:由于傳輸能力的升級,4K會逐漸流行,可以進(jìn)一步提升感受質(zhì)量,但實際上4K之后依然存在更高的帶寬需求,比如還有8K,而且8K對于VR都還是低的,還有更高到12K甚至20K,所以對Codec來講依然存在更高效壓縮的需求,好的codec一定是大有市場的,當(dāng)然如何繼續(xù)提升編碼效率本身已經(jīng)成為一個挑戰(zhàn)了。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 編碼器
    +關(guān)注

    關(guān)注

    45

    文章

    3576

    瀏覽量

    134011
  • 5G商用
    +關(guān)注

    關(guān)注

    0

    文章

    108

    瀏覽量

    14010

原文標(biāo)題:馬思偉:視頻領(lǐng)域是個海洋,可以游泳、沖浪、潛水和遠(yuǎn)航

文章出處:【微信號:livevideostack,微信公眾號:LiveVideoStack】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    卷積神經(jīng)網(wǎng)絡(luò)的一般步驟是什么

    卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,簡稱CNN)是種深度學(xué)習(xí)算法,廣泛應(yīng)用于圖像識別、視頻分析、自然語言處理等領(lǐng)域。本文將詳細(xì)介紹卷積神經(jīng)網(wǎng)絡(luò)的一般
    的頭像 發(fā)表于 07-03 09:11 ?822次閱讀

    數(shù)控加工工藝分析的一般步驟與方法

    數(shù)控加工工藝分析是數(shù)控加工過程中非常重要的環(huán),它涉及到對加工對象、加工設(shè)備、刀具、加工參數(shù)等多個方面的綜合考慮,以確保加工過程的順利進(jìn)行和加工質(zhì)量的滿足。以下是對數(shù)控加工工藝分析的一般步驟與方法
    的頭像 發(fā)表于 06-07 10:27 ?1569次閱讀

    PLC的工作電源一般是多少

    在工業(yè)自動化領(lǐng)域中,PLC(Programmable Logic Controller,可編程邏輯控制器)扮演著至關(guān)重要的角色。PLC作為工業(yè)自動化系統(tǒng)的核心控制設(shè)備,其工作電源的穩(wěn)定性和適應(yīng)性直接關(guān)系到整個系統(tǒng)的正常運行。本文將深入探討PLC的工作電源一般是多少,并從多
    的頭像 發(fā)表于 05-28 16:41 ?3355次閱讀

    新型網(wǎng)絡(luò)釣魚服務(wù)利用2萬個域名攻擊全球百余國家

    新型PhaaS似乎匯集了各種力量,200余種攻擊模板無所不包,可針對性地針對包括郵政、金融、政府、稅務(wù)機構(gòu)在內(nèi)的各行各業(yè)進(jìn)行釣魚攻擊,以及對電信、航空、公共事業(yè)等相關(guān)行業(yè)和機構(gòu)的攻擊。
    的頭像 發(fā)表于 03-29 16:06 ?359次閱讀

    局域網(wǎng)跨網(wǎng)段本地模式音頻采集一般推薦那種產(chǎn)品?

    局域網(wǎng)跨網(wǎng)段本地模式音頻采集一般推薦那種產(chǎn)品? 功能圖解: 網(wǎng)絡(luò)對講終端SV-7011V使用說明 SV-7011V能處理tcp/ip網(wǎng)絡(luò)音頻流,并驅(qū)動揚聲器進(jìn)行播音的終端,主要用于公共數(shù)字廣播
    的頭像 發(fā)表于 03-07 08:42 ?294次閱讀
    局域網(wǎng)<b class='flag-5'>不</b>跨網(wǎng)段本地模式音頻采集<b class='flag-5'>一般</b>推薦那種產(chǎn)品?

    表面安裝設(shè)計和地面圖案標(biāo)準(zhǔn)的一般要求

    電子發(fā)燒友網(wǎng)站提供《表面安裝設(shè)計和地面圖案標(biāo)準(zhǔn)的一般要求.pdf》資料免費下載
    發(fā)表于 02-21 09:24 ?2次下載

    伺服電機效率一般是多少?

    伺服電機效率一般是多少?選型時也得考慮到這個問題吧? 變頻電機一般都標(biāo)功率因素,指的就是電機實際的輸出功率吧? 異步伺服效率 88%; 同步伺服效率 100%,采用絕對值編碼器時效率下降10%-20%.
    發(fā)表于 12-28 06:46

    pcb設(shè)計一般流程步驟

    pcb設(shè)計一般流程步驟
    的頭像 發(fā)表于 12-13 17:30 ?3811次閱讀

    數(shù)混合信號器件的一般接地原則

    電子發(fā)燒友網(wǎng)站提供《數(shù)混合信號器件的一般接地原則.pdf》資料免費下載
    發(fā)表于 11-29 10:45 ?1次下載
    數(shù)混合信號器件的<b class='flag-5'>一般</b>接地原則

    開發(fā)java程序的一般步驟是

    開發(fā)Java程序的一般步驟通常包括需求分析、設(shè)計、編碼、測試和部署等階段。下面將詳細(xì)介紹Java程序開發(fā)的一般步驟。 需求分析階段: 在開始開發(fā)Java程序之前,首先需要進(jìn)行需求分析。需求分析是確定
    的頭像 發(fā)表于 11-28 16:43 ?1530次閱讀

    網(wǎng)線的有效傳輸距離一般是多少米

    網(wǎng)線的有效傳輸距離一般為100米,在兩段雙絞線之間可安裝中繼器,最多可安裝4個中繼器,安裝4個中繼器連接5個網(wǎng)段,則最大傳輸距離可達(dá)500米。
    的頭像 發(fā)表于 11-24 10:20 ?1.2w次閱讀

    一般power amplifier的輸出駐波可接受的最差值(HMC907)是多少?

    為了避免回波造成的PA燒毀,一般PA輸出端連接負(fù)載的端口駐波最差情況下可以是多少
    發(fā)表于 11-22 08:14

    消費級路由器-打造無所連的智能網(wǎng)絡(luò)

    消費級路由器-打造無所連的智能網(wǎng)絡(luò)
    的頭像 發(fā)表于 11-20 16:41 ?383次閱讀

    含受控源電路的一般分析方法

    電子發(fā)燒友網(wǎng)站提供《含受控源電路的一般分析方法.pdf》資料免費下載
    發(fā)表于 11-18 14:27 ?0次下載
    含受控源電路的<b class='flag-5'>一般</b>分析方法

    功率放大電路的一般問題

    電子發(fā)燒友網(wǎng)站提供《功率放大電路的一般問題.pdf》資料免費下載
    發(fā)表于 11-17 16:01 ?0次下載
    功率放大電路的<b class='flag-5'>一般</b>問題