0引言
DirectsHow應用框架完成了流媒體處理的底層工作,使得編程者無需關心數(shù)據(jù)如何輸入,以及處理完后如何輸出,而只需關心如何對輸入數(shù)據(jù)進行處理。H.264視頻編解碼標準具有高壓縮比和優(yōu)良的網(wǎng)絡親和性,被普遍認為是最有影響力的流媒體視頻壓縮標準。將Direct-show和H.264兩種相結合的流媒體播放器無疑將具有非常優(yōu)秀的性能。
1Directshow技術和H.264視頻壓縮標準簡介
Directshow是微軟公司提供的一套流媒體開發(fā)軟件包,為在windows平臺上處理各種格式的媒體文件的回放、音視頻采集的高性能要求的多媒體應用,提供了完整的解決方案。
Directshow是一套完全基于COM的應用系統(tǒng),該系統(tǒng)位于應用層中,它使用FilterGraph的模型來管理整個數(shù)據(jù)流的處理過程;參與數(shù)據(jù)處理的各個功能模塊叫Filter;各個Filter在FilterGraph中按照一定的順序連接成一條“流水線”協(xié)同工作。Filter是一個COM組件,其功能可以由用戶自行實現(xiàn),DirectShowSDK也為用戶提供了一些標準的Filter供用戶使用。各個Filter在FilterGraph中按一定順序通過Pin互相連接起來,Pin也是一個COM對象。
H.264是由ITU-T和ISO/IEC的聯(lián)合開發(fā)組共同開發(fā)的最新國際視頻編碼標準。H.264/AVC視頻編碼標準在編碼質量和壓縮比上比原有的視頻編碼標準都有了明顯的提高。在相同的視覺感知質量上,編碼效率比H.263,MPEG-2和MPEG-4提高了50%左右。H.264不僅具有優(yōu)異的壓縮性能,而且具有良好的網(wǎng)絡親和性。因此,H.264被普遍認為是最有影響力的流媒體視頻壓縮標準。
2系統(tǒng)設計框架
本系統(tǒng)基于Direotshow應用框架和H.264視頻壓縮標準,實現(xiàn)了從網(wǎng)絡接收流媒體數(shù)據(jù),并在客戶端實時播放的功能。流媒體文件是采用H.264編碼的AVI文件,由于directshow提供了AVISplitteRFilter、AudioDecoder和標準的Video/AudioRenderer,因此,本系統(tǒng)只需設計自定義的網(wǎng)絡源Filter、H.264解碼Filter。
多媒體流式傳輸實際上牽涉到兩個方面的技術。其一就是服務器與客戶端的通信技術,包括多媒體數(shù)據(jù)的傳輸、命令控制等;其二就是客戶端對接收到的多媒體流實時解碼后播放的技術。顯然,網(wǎng)絡通信可以使用windowssocket技術,多媒體流的解碼播放可以使用direct-show技術。本文采用direetshow應用框架,設計了網(wǎng)絡源filter和h.264解碼filter,并通過FilterGraph構建了流媒體播放器。
播放本地基于H.264編碼的AVI文件的FilterGraph如圖1。只需將本地FileSourceFilter替換為網(wǎng)絡源Filter,將CoreAVCVideoDe-coder替換為h.264解碼Filter,即可實現(xiàn)網(wǎng)絡H.264視頻播放器。
?
3系統(tǒng)的設計與實現(xiàn)
3.1Filter設計流程
Filter的編碼實現(xiàn)包括Filter的注冊信息、Filter上的框架函數(shù)實現(xiàn)、邏輯控制類實現(xiàn)、自定義接口實現(xiàn)、屬性頁實現(xiàn)、產(chǎn)權保護等。
首先,要對Filter所要完成的功能和它在FilterGraph中的位置進行分析,以確定filter模型,選擇一個合適的基類;然后,再定義輸入輸出PIN以及自定義接口,注冊Filter信息;最后實現(xiàn)基類的全部純虛函數(shù)和自定義接口函數(shù),并重寫基類的相關函數(shù)以定制filter功能。
3.2網(wǎng)絡源Filter的設計
源Filter主要功能是接收服務器發(fā)來的流媒體數(shù)據(jù),并提供給FilterGraph中其它Filter使用。
由于directshow自帶的AVIsplitter工作于拉模式,故該源Filter也工作于拉模式。
本源Filter采用雙緩沖循環(huán)隊列技術來實現(xiàn)數(shù)據(jù)的接收和向下一級Filter傳遞數(shù)據(jù)。采用該技術有如下理由:
(1)在SourceFilter與SpliRer連接的過程中,會從SourceFilter中讀取一部分數(shù)據(jù),以獲得數(shù)據(jù)的格式描述,否則FilterGraph無法完成連接。源Filter與SplitterFilter進行連接前,應啟動一個等待線程,當SourceFilter的數(shù)據(jù)緩存預先接收到足夠的數(shù)據(jù)后,再構建完整的FilterGraph。
(2)當完整的FilterGrapH構建完成,并且處于運行狀態(tài)后,SourceFilter必須動態(tài)地接收數(shù)據(jù),并持續(xù)地把新數(shù)據(jù)提供給SplitteRFilter,雙緩沖循環(huán)隊列既充分利用內存空間,又能為SplitterFilter提供穩(wěn)定的數(shù)據(jù)源。
(3)緩沖隊列可以穩(wěn)定碼率,有效減小網(wǎng)絡延時、阻塞和抖動的影響。
源Filter的工作過程如下:建立一個循環(huán)緩沖隊列,隊列尾指針用于緩沖從網(wǎng)絡接收的數(shù)據(jù),隊列頭指針供Splitter讀取數(shù)據(jù),進行音視頻分離,并傳給下一級Decoder處理;當Socket接收到網(wǎng)絡數(shù)據(jù)后,將數(shù)據(jù)插入隊列尾部,并使尾指針后移;當Splitter需要讀取數(shù)據(jù)時,從隊列頭讀取數(shù)據(jù),并使頭指針后移。
流媒體傳輸采用客戶端/服務器的架構,服務器與客戶端之間還有一個Socket通信協(xié)議問題,由于流媒體是連續(xù)的,它的同步點不能隨意選擇,因此,為了傳送流媒體數(shù)據(jù),必須使用面向連接的可靠的傳輸協(xié)議(TCP)??蛻舳伺c服務器端的控制與反饋消息,則可以使用(UDP)來傳輸。服務器端首先創(chuàng)建一個偵聽Socket,偵聽來自客戶端的連接請求。一旦偵聽到客戶端的請求,服務器端就創(chuàng)建一個用于數(shù)據(jù)傳送的Socket,并綁定到請求連接的客戶端,此時,服務器處于數(shù)據(jù)傳送的就緒狀態(tài)。當客戶端發(fā)出命令,服務器再根據(jù)命令的類型執(zhí)行相應的操作,如數(shù)據(jù)發(fā)送、停止、斷開連接等。
在服務器端首先將連續(xù)的H.264流分成一塊一塊小包的負載數(shù)據(jù),并且加上一個信息頭一起使用TCP協(xié)議發(fā)送;在客戶端根據(jù)信息頭描述,將小包的負載數(shù)據(jù)進行拼裝,然后進行H.264的解碼播放。Socket數(shù)據(jù)傳送結構為:負載類型(8bit)、負載數(shù)據(jù)長度(16bit)和負載數(shù)據(jù)包(2324Byte)。
客戶端的實現(xiàn)可以參考SDK中的MEMFileFilter,直接從SDK例子將asyncrdr.cpp、asyncrdr.h、asyncio.cpp、asyneio.h四個文件拷貝過來,然后在MemFilter.h文件中從CAsyncStream派生流處理類CMemStream,定制數(shù)據(jù)源并進行數(shù)據(jù)的讀取操作;從CAsyncReader派生濾波器類CMemReader,實現(xiàn)含1個輸出PIN的SourceFilter框架,完成與SplitterFilter的連接。
網(wǎng)絡源濾波器類間數(shù)據(jù)流程如圖2,下一級Filter“拉”線程數(shù)據(jù)流程如圖3。其中:CAsyneStream用以標示數(shù)據(jù)流;CAsyneRequest標示輸入與輸出請求;CAsyncIo實現(xiàn)數(shù)據(jù)輸入和輸出的控制。編程主要實現(xiàn)CMemStream:Read()函數(shù)以實現(xiàn)從特定的數(shù)據(jù)源讀取數(shù)據(jù)到下一級Filter的Sample中。
?
3.3H.264解碼Filter的設計
該濾波器工作于Splitter和Rendererfilter之間,包含一個輸入和一個輸出,且輸入和輸出pin上的媒體類型不一致,故選擇CTrans-formFilter作為基類,派生子類CX264Decode。
ffmpeg是一個集錄制、轉換、音/視頻編碼解碼功能為一體的完整的開源解決方案。利用ffmpeg中的Libavformat和libavcodec庫訪問大多數(shù)視頻文件格式是一個很好的方法。將ffmpeg中關于h.264解碼的操作封裝為C++類,供H.264解碼Filter調用以實現(xiàn)解碼功能。
子類CX264Decode必須要實現(xiàn)的純虛函數(shù)有:CheckInputType()實現(xiàn)輸入Pin上的媒體類型檢查;CheckTransform()檢查是否支持從該輸入pin到輸出pin的變換操作;DecideBufferSize()決定Samlple內存的大小;GetMediaType():提供輸出Pin上的首選媒體類型;Transform():實現(xiàn)解碼變換。
子類CX264Decode可選的重寫虛函數(shù)有:初始化和反初始化流:StartStreaming()和StopStreaming();響應質量通告消息:AlterQuali-ty();獲取媒體類型被實際設置的時間:SetMediaType();連接時獲取額外的接口:CheckConnect()、BreakConnect()和CompleteConneet();定制變換過程:Receive();標準化設置輸出Sample:InitializeOutputSample()。
本Filter設計主要流程如下:
(1)Filter注冊信息
定義類工廠模板,填寫Filter的注冊信息;同時實現(xiàn)DLL文件所必須實現(xiàn)的注冊和反注冊函數(shù):DLLRegisterServer和DLLUnregisterSe-rver。
(2)框架函數(shù)的實現(xiàn)
實現(xiàn)函數(shù)CreateInstanee,用于創(chuàng)建Filter對象實例;實現(xiàn)函數(shù)CheeklnputType,用于對輸入Pin上的媒體類型檢查;實現(xiàn)函數(shù)Transfo-rm,用于H.264的解碼操作;實現(xiàn)函數(shù)NonDelegafingQueryIntefface,用于暴露Filter支持的自定義接口,使應用程序可以設置解碼器的參數(shù);實現(xiàn)函數(shù)CompleteConnect,可以在輸入Pin成功連接后取得媒體類型描述,并將輸入數(shù)據(jù)的格式設置給應用邏輯控制對象;實現(xiàn)函數(shù)St-artStreaming和StopStreaming,可以分別調用應用控制邏輯對象的相應函數(shù),進行流處理的初始化和反初始化操作。
(3)邏輯控制類的實現(xiàn)
邏輯控制類是本Filter設計的核心,框架函數(shù)和自定義接口函數(shù)的相關操作都是委托給邏輯控制類來實現(xiàn)的。該類實現(xiàn)了H.264.的解碼參數(shù)的設置與解碼操作,主要調用封裝了H.264解碼的C++類來實現(xiàn)。
利用ffmpeg庫進行H.264解碼時,需要自定義兩個關鍵函數(shù):open_net_file()和read_buffer_frame()。其中,open_net_file()函數(shù)完成與流媒體服務器的連接,接收指定流媒體文件的流相關信息,并返回類型為AVFormatContext結構體的值。read_buffer_frame()函數(shù)從bu-ffer緩沖中讀取一幀數(shù)據(jù),并交由庫函數(shù)avcodec_decode_video()解碼。
(4)自定義接口的實現(xiàn)
將Filter類從自定義接口類派生,并聲明自定義接口的所有接口方法;然后在Filter類的實現(xiàn)文件中實現(xiàn)這些接口法,其實大都是調用應用邏輯控制類的相應函數(shù);最后在函數(shù)NonDelegatingQueryInteRFace中暴露我們的自定義接口。
3.4播放器的設計
播放器采用DirectsHow應用框架,采取界面、控制邏輯和數(shù)據(jù)分離的三層程序設計方法。界面類直接從標準的對話框類CDialog派生,在界面類中定義兩個自定義類:數(shù)據(jù)封裝類和邏輯控制類。界面類表達一種用戶操作邏輯;數(shù)據(jù)封裝類集中管理各種參數(shù);邏輯控制類具體實現(xiàn)業(yè)務應用邏輯。采取Directshow應用框架,不必關心數(shù)據(jù)如何輸入和輸出,這些問題都由Filter框架負責,只需更多的關注數(shù)據(jù)處理的算法實現(xiàn)、效率優(yōu)化等問題。采取界面、控制邏輯和數(shù)據(jù)分離的設計結構,不僅使程序框架清晰、容易被人理解,而且具有良好的移植性和擴展性。
播放器基于FilterGraphManager構建包含網(wǎng)絡源Filter和H.264解碼Filter的FilterGraph,即可實現(xiàn)網(wǎng)絡流媒體的播放。界面類實現(xiàn)視頻顯示界面與用戶的操作交互,控制邏輯可以控制視頻的播放、暫停、停止、解碼參數(shù)設置等,數(shù)據(jù)類實現(xiàn)對數(shù)據(jù)的操作管理。
4結束語
本流媒體播放器系統(tǒng)采用了Directshow應用框架和H.264視頻編解碼標準,能很好的實現(xiàn)網(wǎng)絡流媒體視頻的播放,具有結構清晰、良好的可擴展性與可移植性。由于WINCE系統(tǒng)是微軟提供的嵌入式實時操作系統(tǒng),提供了對Directshow的應用支持,故本系統(tǒng)也可以很好的移植到win-ce的嵌入式應用平臺,實現(xiàn)嵌入式端的流媒體視頻播放。同時,本流媒體播放系統(tǒng)也可很好地移植到視頻點播系統(tǒng)中,因其采用高壓縮比、低碼率的H.264視頻編解碼標準。能有效減少網(wǎng)絡負載、減小帶寬,從而減輕網(wǎng)絡對流媒體傳輸中所存在的丟包、抖動、延時等影響。
評論
查看更多