0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

從四個(gè)方面分析云游戲自動(dòng)音視頻測試

LiveVideoStack ? 來源:簡書 ? 作者:簡書 ? 2020-09-05 11:16 ? 次閱讀

在日益臨近的5G時(shí)代下,5G網(wǎng)絡(luò)和新的流視頻游戲服務(wù)將在未來幾年內(nèi)讓云游戲的增長一觸即發(fā),云游戲已漸成行業(yè)熱點(diǎn)。英特爾基于OWT(Open WebRTC Toolkit)也對云游戲使用場景所需要的高分辨率,高比特率和高幀率的視頻超低延時(shí)的實(shí)時(shí)傳輸做了深入研究和廣泛優(yōu)化。云游戲中音視頻延時(shí),音畫同步尤為重要。游戲中最為關(guān)注的音視頻檢測是怎么實(shí)現(xiàn)的?音視頻同步檢測是通過什么方式自動(dòng)化實(shí)現(xiàn)的呢?本次講座將圍繞上述幾個(gè)問題從痛點(diǎn),難點(diǎn)和解決方案一一展開。

1. 項(xiàng)目背景介紹

大家看到這些圖會(huì)想到什么?會(huì)不會(huì)想到我們最近疫情在家工作的場景。隨著流量包的提升和帶寬計(jì)費(fèi)的下降,長短視頻最近非?;鸨?,疫情期間,在家上班、小朋友在家學(xué)習(xí)、在家會(huì)議已經(jīng)成為了一種生活的常態(tài),它們從生活的可選項(xiàng)瞬間變成了生活的必需品。上圖左邊的云游戲作為一種新的游戲視頻服務(wù)方式,在未來幾年云游戲的增長一定會(huì)因?yàn)楦鞣N原因一觸即發(fā)。云游戲已然成為了業(yè)界追蹤的熱點(diǎn),我們英特爾基于OWT對于云游戲使用場景所需要的高分辨率、高幀率的視頻,同時(shí)又需要滿足低延時(shí)的實(shí)時(shí)傳輸,在這方面我們做了深入的研究和廣泛的優(yōu)化。其實(shí)無論是音視頻會(huì)議系統(tǒng)還是云游戲場景中,音視頻的質(zhì)量,用戶的體驗(yàn)比如說音視頻的延時(shí)、音視頻的卡頓、音畫是否同步都極為重要。那么最為關(guān)注的音視頻的檢測是怎么實(shí)現(xiàn)的呢,比如說音畫同步怎么做?音視頻的檢測方法和算法有哪些呢?怎么融入到我們檢測體系中呢?這就是我將一一展開和大家講解的內(nèi)容。

2. 音視頻傳播流程分析 2.1 傳統(tǒng)音視頻傳輸流程和問題分析

傳輸流程

上圖是一個(gè)傳統(tǒng)的音視頻傳輸?shù)牧鞒蹋筮吺前l(fā)送方,我們可以想像成一個(gè)一對一的會(huì)議模式,右邊是接收方。發(fā)送方首先要進(jìn)行視頻的采集,不管是用什么設(shè)備,用瀏覽器、用中間設(shè)備、用虛擬攝像頭、用真正的文件傳輸或是用真正的Camera傳輸或者視頻,首先都得進(jìn)行采集。采集之后進(jìn)行前處理降噪,加水印或美顏的功能,再進(jìn)行編碼,通過網(wǎng)絡(luò)的傳輸,編碼后的視頻傳輸?shù)街虚g服務(wù)器,服務(wù)器會(huì)進(jìn)行視頻的中轉(zhuǎn)、處理,比如說會(huì)議模式會(huì)將多路收集到的視頻進(jìn)行合并、壓縮、轉(zhuǎn)碼等等。在服務(wù)器會(huì)進(jìn)行解碼壓縮再編碼,隨后視頻通過網(wǎng)絡(luò)傳輸送到接收方,接收方拿到這個(gè)視頻后會(huì)進(jìn)行后處理和渲染。

問題分析

在整個(gè)流程中哪些地方會(huì)對音視頻的質(zhì)量或者說發(fā)送給接收方的音視頻造成偏差呢?首先是發(fā)送方的采集,采集會(huì)有有損的損耗;其次是前處理;再然后是編碼,最后是發(fā)送方到接收方網(wǎng)絡(luò)因素的干擾,可能是網(wǎng)絡(luò)帶寬,網(wǎng)絡(luò)丟包等等影響。服務(wù)端這邊如果進(jìn)行一個(gè)轉(zhuǎn)碼,解碼,再編碼,或者進(jìn)行編碼的轉(zhuǎn)變,或者進(jìn)行一個(gè)壓縮都是有損的。接收方這邊處理渲染也會(huì)帶來一部分的損耗,可以看到視頻從發(fā)送方到接受方的過程會(huì)經(jīng)過各種各樣的曲折。 2.2 云游戲音視頻傳送流程分析

其實(shí)云游戲和上述傳統(tǒng)音視頻傳輸流程很類似,它們不同的點(diǎn)在于在云游戲的云端會(huì)有個(gè)終端游戲服務(wù)器,終端游戲服務(wù)器會(huì)進(jìn)行游戲音視頻的捕捉,在捕捉之后將游戲音視頻進(jìn)行一個(gè)編碼,編碼之后傳輸?shù)娇蛻舳?,客戶端可能是瀏覽器,也有可能是終端設(shè)備,再解碼、后處理、渲染播放。那么整個(gè)流程中哪些會(huì)對音視頻有影響呢?一是服務(wù)端音視頻的捕捉和編碼;二是網(wǎng)絡(luò)傳輸;三是終端的解碼,后處理,渲染播放等等。

3. 音視頻評估標(biāo)準(zhǔn)和方法

在了解到了傳統(tǒng)的音視頻傳輸流程中一些步驟會(huì)導(dǎo)致音視頻偏差,我們需要思考如何做音視頻的評估,評估時(shí)的方法和標(biāo)準(zhǔn)及其使用。我將音視頻評估標(biāo)準(zhǔn)和方法分為了以下幾個(gè)部分:視頻質(zhì)量評估、音頻質(zhì)量評估、音畫同步、音視頻延時(shí)。 3.1 視頻質(zhì)量評估 視頻的質(zhì)量評估分為兩種:主觀評估和客觀評估。

主觀評估顧名思義就是用人工評估,那么人工評估并不是我們聽一聽就好了這么簡單。人工評估目前來說在各種協(xié)會(huì)比如說IEC、EBU、ITU等等國際電信聯(lián)盟都有相應(yīng)的標(biāo)準(zhǔn),以上的圖是我截取它們標(biāo)準(zhǔn)文檔的形式,首先是左上角的一個(gè)音頻設(shè)備,如果要搭建一個(gè)音視頻的實(shí)驗(yàn)室,需要注意廣播設(shè)備的設(shè)置位置、廣播設(shè)備的距離、分貝的大小。那我們對視頻評估要注意音視頻實(shí)驗(yàn)室觀看距離的設(shè)定、觀看視頻序列的設(shè)定、對觀測人員人數(shù)的限定(男女比例,老少比例,國籍比例等)。 由此可以看出搭建一個(gè)主觀評估的音視頻實(shí)驗(yàn)室所需要耗費(fèi)的時(shí)間、財(cái)力、人力成本是比較高的。評估之后會(huì)得出什么樣的結(jié)論呢?通常是一個(gè)1分到6分的結(jié)果:一分表示非常差、3分表示還可以接受,5分之后是非常好了。除了人力財(cái)力消耗比較高以外,主觀評估問題還有:我們要對非專業(yè)人員以專業(yè)標(biāo)準(zhǔn)進(jìn)行培訓(xùn);隨機(jī)選取的人員也會(huì)導(dǎo)致主觀的差異、重復(fù)性低、數(shù)據(jù)無法量化,缺乏參考性、受到測試客觀環(huán)境的影響,比如如果視頻觀看遠(yuǎn)近的切換,順序的切換有可能會(huì)影響最終的結(jié)果。當(dāng)然它也有優(yōu)點(diǎn),這樣的結(jié)果始終是人的感官,而評估的目標(biāo)就是為了知道這個(gè)音視頻給人感官的最后結(jié)果。

視頻客觀評估,通常稱為VQA(Video Quality Assessment),而Video通常是用一幀一幀的視頻幀數(shù)來組成的,每個(gè)視頻幀其實(shí)就是一張張圖片,我們會(huì)將VQA轉(zhuǎn)成IQA(Image Quality Assessment)。IQA的研究算法其實(shí)有很多,目前有很多學(xué)者會(huì)將IQA加入時(shí)域的特性,再轉(zhuǎn)成VQA的結(jié)果,進(jìn)行客觀評估。客觀評估分為兩類:有參考評估和無參考評估。

客觀評估-有參考評估

有參考評估是什么?從字面上非常好理解,就是將參考視頻和待評估視頻一一對標(biāo)之后輸入到評估算法和評估體系,最后得到分?jǐn)?shù)。

面對五花八門的各種算法,什么叫做好的算法呢?在業(yè)界上有很多開源的數(shù)據(jù)庫。各種學(xué)者和研究人員將他們的算法進(jìn)行研究。上圖左邊TID 2008是大家都知道的圖像的數(shù)據(jù)庫,其實(shí)更新的是TID 2013。根據(jù)TID 2008的文檔描述,它是由一些正常的圖片和一些扭曲之后的圖片組成的。比如說正常圖像占一部分,接下來會(huì)增加一些高斯噪聲的圖片,或者是一些有選編碼之后的圖片,這些都有詳細(xì)的描述。 右圖是我們從公開的算法數(shù)據(jù)庫中獲取的,判斷算法的好壞通常是選幾個(gè)database,在database上進(jìn)行評測,評測算法和數(shù)據(jù)庫中評估出來的評分,數(shù)據(jù)庫除了之前所說的圖像,還有一些扭曲視頻,另外一個(gè)很重要的因素是它會(huì)對提供的每張圖片做一個(gè)主觀打分的數(shù)值。算法和這個(gè)數(shù)值的相關(guān)性可以從PLCC、SROCC計(jì)算。相關(guān)關(guān)系函數(shù)的結(jié)果表示的是算法和真實(shí)的MSE值的偏差。通常絕對值越高,表示算法的性能越好。在拿到一些精簡的算法后會(huì)在各個(gè)數(shù)據(jù)庫中進(jìn)行對比,比如PSNR、SSIM、VMAF等等。在每一個(gè)database里,這些相關(guān)關(guān)系函數(shù)得出的結(jié)果都比已有的算法好,那么就是一個(gè)很好的新算法。

那么在我們的體系中,我選了三個(gè)比較經(jīng)典的算法PSNR、SSIM、VMAF作為有參考的評測標(biāo)準(zhǔn)。我們有了這些有參考的評算標(biāo)準(zhǔn)是否就足夠了呢?我們怎么將這些評估算法加入現(xiàn)有的體系中呢?

首先我們要解決的最核心的問題是測試結(jié)果和流程的可重復(fù)性,這是客觀評估和主觀評估非常大的差別。因?yàn)橛辛酥貜?fù),所以可以重復(fù)地看問題出在哪兒,重現(xiàn)問題所在點(diǎn)。通常的做法是將隨機(jī)視頻輸入流,轉(zhuǎn)成固定視頻輸入流。光是轉(zhuǎn)成固定輸入流還不夠,將隨機(jī)視頻輸入流轉(zhuǎn)成固定視頻輸入流是恒定長度幀數(shù)的視頻流,比如說一千幀這樣一個(gè)視頻,那么我們在播放的時(shí)候就是一千幀重復(fù)播放,接收到的也是一千幀循環(huán)播放的視頻,我們需要知道我們接收到的視頻是對應(yīng)的發(fā)生到的哪一幀,就要幀與幀之間對標(biāo)之后才能算出有參考的算法,因?yàn)槟切┧惴ǘ际菐c幀之間對比出來的。 我們做了視頻幀的定位,在發(fā)送的時(shí)候就在視頻幀的左上角進(jìn)行一個(gè)視頻幀的標(biāo)記,標(biāo)記的是發(fā)送了多少幀,第幾幀。那么在接收的時(shí)候,這個(gè)幀就會(huì)原生地傳輸過來,然后我們在后臺進(jìn)行左上角幀字符的重識別。識別之后我們就知道是第幾幀,他在發(fā)送的時(shí)候我們進(jìn)行一個(gè)循環(huán)標(biāo)記符,通過循環(huán)標(biāo)記符和左上角視頻幀的定位到第幾輪的第幾幀;通過接收到的視頻幀序列,我們就可以反過來將發(fā)送的視頻序列進(jìn)行挑選。需要進(jìn)行挑選的原因是在接收到的視頻里面,通過網(wǎng)絡(luò)之后會(huì)有一些幀的流失,比如發(fā)送的是100幀收到的只有50幀,那么根據(jù)接收到的50幀我們就找到發(fā)送對應(yīng)的50幀進(jìn)行一一對標(biāo)的發(fā)送序列。發(fā)送序列和接收序列之間進(jìn)行對比,輸入到有參考的算法,最后就可以得到相應(yīng)的評估算法的結(jié)果。

客觀評估-無參考評估

在現(xiàn)實(shí)生活中,我們看到了有參考的評估,在評估一個(gè)編碼的算法時(shí)用得很多。但真實(shí)在直播環(huán)境下,有參考是非常難做的,因?yàn)樗枰獢[脫干擾。那么這就涉及到了另一種客觀評估方法無參考評估,無參考評估也很好理解,我只有待測視頻,直接將待測視頻輸入到評估算法模型中,我就可以得到這樣的一個(gè)結(jié)果。

無參考評估分為兩大類:打分類和全幀掃描。 打分類就是和有參考一樣,將待測視頻輸入到無參考的算法中就可以的得到一個(gè)分?jǐn)?shù)。 打分類通常有兩類。第一種是通過將VQA轉(zhuǎn)成IQA的無參考算法,這些算法都比較成熟了,我們可以看到有一些圖像熵評估算法(GRNN),空域特性評估算法(BRISQUE),除此之外很多學(xué)者都在研究DL算法,大家知道之前LiveVideoStackCon上有演講就是基于Camera的視頻的DL評估算法。整體來說,無參考的打分目前來看它的準(zhǔn)確度與數(shù)據(jù)庫中MSE的偏差還是比較大的,它是沒有辦法和有參考評估并列的,準(zhǔn)確度還是比較低的。

全幀掃描的意思是對收到的每一幀的數(shù)據(jù)都進(jìn)行掃描和判斷。 全幀掃描又可以分為兩大類。第一個(gè)是圖片像素檢測,把視頻幀作為一張圖片,通過圖片的像素層進(jìn)行模糊度檢測,來判斷這個(gè)視頻是不是帶有模糊,通過像素塊內(nèi)和像素塊外的相關(guān)項(xiàng)來檢測是否有馬賽克的塊效應(yīng),同時(shí)也可以檢測是否有噪聲,快衰弱的評判算法,這些技術(shù)都已經(jīng)比較成熟了??晌覀兒髞碛职l(fā)現(xiàn)我們雖然有很多算法,但是我們不能覆蓋現(xiàn)實(shí)中的馬賽克。以現(xiàn)實(shí)中的馬賽克檢測來說,很多馬賽克并沒有被檢測出來,它可能和我們期望的像素成塊的有差距,說明它的算法不夠通用。目前很多公司包括我們自己也還在研究DL這一塊,我們可以根據(jù)不同產(chǎn)品來定制,比如說我們就想檢測出來,正常視頻幀有多少,我的異常視頻幀有多少,可以做分類的算法,如果有足夠多的視頻,可以進(jìn)行標(biāo)注正常和非正常。還可以通過的DL聚類檢測,大部分時(shí)候,我們的標(biāo)注圖像信息不夠,我們可以通過一些聚類的檢測,做一些無參考的聚類、全幀掃描,所以可以根據(jù)自己的產(chǎn)品做一些相關(guān)的定制。

除了上文我們一直在講的視頻幀質(zhì)量,實(shí)際上大部分產(chǎn)品,比如說在打游戲時(shí)候,你的視頻畫面是清晰的,但視頻過于卡頓就會(huì)十分影響用戶體驗(yàn)。那么在有的情況下,比如說在開會(huì)的時(shí)候,并不要求視頻幀的質(zhì)量很清晰,可能更加關(guān)注流暢度;看電影的時(shí)候,每個(gè)人的感官是不一樣的,我可能會(huì)希望視頻更清晰,流暢度稍微差一點(diǎn)也沒有關(guān)系。那我們有沒有這樣一些相關(guān)的指標(biāo)可以體現(xiàn)出用戶的QoE體驗(yàn)?zāi)兀?

首先介紹一下我們的卡頓時(shí)長算法,將視頻按70000 fp值錄下來,每一幀通過濾波器,將每一幀分為8*8的像素塊,并為每一個(gè)像素塊的上一幀和下一幀計(jì)算絕對差值之和(SAD),我們就可以定義一個(gè)準(zhǔn)則,設(shè)一個(gè)閾值,最高和最低差值,如果兩個(gè)視頻幀之間有足夠多的8*8之間的SAD大小都低于最低值,或者說我沒有一塊SAD大于最大值,在這種情況下就認(rèn)為這兩張圖片是一樣的,以此認(rèn)為它出現(xiàn)了卡頓,卡頓了多久就是卡頓的時(shí)長,卡頓了多少次就是卡頓的頻率,通常來說一秒左右的卡頓是人的肉眼可以感知的。但是我們又發(fā)現(xiàn),如果卡頓頻率過快也會(huì)覺得畫面很卡。除了卡頓時(shí)長和卡頓頻率之外,還可以計(jì)算首幀時(shí)間,首幀時(shí)間就是當(dāng)畫面在特定的情況下首幀出現(xiàn)的時(shí)候,畫面從不變到畫面突變的情況,這種情況下我們可以按照上面的算法算出首幀出現(xiàn)的時(shí)間。 3.2 音頻質(zhì)量評估

客觀評估-有參考評估

從客觀評估來講,它的方法主要分兩種,有參考評估和無參考評估。有參考評估就是參考視頻和待測音頻,將兩個(gè)音頻進(jìn)行對標(biāo),傳輸?shù)皆u估算法模型里,得到相應(yīng)的分?jǐn)?shù)。打分的結(jié)果也和視頻一樣,上圖的分?jǐn)?shù)是舉出例子可以看出哪些是滿意的哪些是不滿意的。

在這主要介紹客觀評估的算法PESQ,這是大家經(jīng)常通用的算法。我們來看一下這套算法的主要流程。第一步是信號處理,我們將發(fā)送的音頻和待測的音頻進(jìn)行信號處理,將兩個(gè)音頻進(jìn)行一一對標(biāo),將時(shí)間對齊等等。第二步是建模,第一個(gè)模型是感知模型,這步中還包括頻率的映射以及帶寬信號的過密;第二個(gè)模型是認(rèn)知建模,包括一些叫聲相關(guān)的信息組合進(jìn)來,最后將它組合到MSE計(jì)算值的統(tǒng)計(jì)中,計(jì)算參考信號和失幀待評估信號之間的差,正值代表有噪聲,負(fù)值代表無噪聲或有較小的噪聲。這個(gè)模型的優(yōu)點(diǎn)是它允許發(fā)現(xiàn)發(fā)送信號和接收信號有延時(shí)導(dǎo)致的偏差,它會(huì)將這些延時(shí)干擾去除,真正的評價(jià)參考信號和失幀待評估信號之間的偏差。但也有專家認(rèn)為這樣是不合理的,因?yàn)橹虚g有延時(shí)也會(huì)影響音頻感官的結(jié)果。

上圖是從polqa網(wǎng)頁上獲取的幾大有參考音頻評估算法的對比,圖下有網(wǎng)頁地址,它認(rèn)為寬帶的算法可以作為PESQA后一代的音頻算法,目前更為大眾所用,但是這個(gè)算法需要購買LICENSE,所以大家用PESQ也是可以的。

客觀評估 無參考評估

無參考評估分為兩大類:專項(xiàng)檢測和通用檢測。有些時(shí)候我們想進(jìn)行特征音的查找,比如說人聲、噪音、歌聲的檢測。我們通過聲音指紋,相關(guān)度來進(jìn)行特征音的檢測。除了這些專項(xiàng)檢測之外,也有些通用的檢測。我們可以將音頻型號輸入到DL序列號的模型進(jìn)行打分評估,去年LiveVideoStackCon上也有介紹這樣的通用檢測方法,目前來說這種無參考檢測,它的準(zhǔn)確度與有參考檢測的準(zhǔn)確度對比還是相差很多。 3.3 音畫同步

單獨(dú)講音畫同步的原因是音畫同步是視頻和音頻評估的另外一部分。是不是音頻和視頻發(fā)送和接收做到分秒不差才能叫做音畫同步呢?那么多差才叫差也是有一定標(biāo)準(zhǔn)的。上圖所列的幾個(gè)組織,比如說國際電信聯(lián)盟、美國數(shù)字電視國家標(biāo)準(zhǔn)ATSC、歐洲廣播聯(lián)盟標(biāo)準(zhǔn)EBU等等都有相應(yīng)標(biāo)準(zhǔn)。目前還是以ITU的標(biāo)準(zhǔn)作為主導(dǎo)方向。

主觀評估

上圖是ITU標(biāo)準(zhǔn)的定義。這是一個(gè)場景定義,現(xiàn)在是棒球的直播現(xiàn)場,棒球運(yùn)動(dòng)員正在打球,下面有一個(gè)實(shí)時(shí)的播音員,通過兩個(gè)采集設(shè)備進(jìn)行采集之后,經(jīng)過中間中轉(zhuǎn),包括信息塔的傳輸或網(wǎng)絡(luò)的傳輸?shù)鹊龋ㄋx的比較早,所以是電視信號),最后終端用戶接收。 那音畫之間的差別多少是差呢?多少差別是可以接受的程度呢?最后他們總結(jié)了一個(gè)標(biāo)準(zhǔn),負(fù)表示畫前音后,正表示音前畫后。他們認(rèn)為畫前音后100ms到音前畫后25ms是無法感知的,所以認(rèn)為這個(gè)時(shí)候視頻是音畫同步的。畫前音后125ms到音前畫后45ms是可以感知的,<-185ms到>90ms是不可以接受的。這是他們定義出來的標(biāo)準(zhǔn)。對于這個(gè)標(biāo)準(zhǔn),我們有什么辦法對他做自動(dòng)化的評估呢?

客觀評估

上圖就是我們經(jīng)常做的工作。大概說一下整個(gè)流程供大家參考。我們在音頻和視頻中分別插入一系列的特征音和特征視頻幀,在插入的同時(shí),我們在發(fā)送時(shí)對每個(gè)特征音和特征視頻幀記了時(shí)間錯(cuò)信息,比如它標(biāo)記成第一個(gè)特征視頻幀和第一個(gè)特征音頻幀的時(shí)間偏差,把它記錄下來。那么在接收方這邊,我們同樣的將音頻和視頻每一個(gè)都做后處理,先錄制存儲下來,然后在視頻中查找第一個(gè)特征視頻幀,計(jì)算它的時(shí)間偏差,同時(shí)查找第一個(gè)它對應(yīng)的特征音頻幀,記錄它的時(shí)間信息,兩個(gè)相減,接收到的偏差和發(fā)送的偏差進(jìn)行對標(biāo)就可以算出音畫同步的偏差數(shù)值。 3.4 音視頻延遲

音視頻延時(shí)測試

在前文也有介紹過怎么處理音視頻的延時(shí),在做白盒干擾的時(shí)候,我們在每一個(gè)視頻幀的左上角進(jìn)行視頻幀的標(biāo)注信息,可以知道這是第幾幀,在發(fā)送的同時(shí)會(huì)記一個(gè)時(shí)間戳給這一幀,接收到這樣的視頻序列之后,我們對接收到的每一個(gè)視頻幀標(biāo)記時(shí)間信息,通過視頻幀的數(shù)據(jù)可以反推這是第幾幀。如果找到對標(biāo)的兩個(gè)幀的時(shí)間信息,直接相減就可以得到端對端的延時(shí),這里我還加一個(gè)bias是因?yàn)槲覀儼l(fā)送和接收要做到時(shí)間同步,發(fā)送和接收時(shí)間是兩臺不同的機(jī)器,有時(shí)間的偏差,只有考慮到這一點(diǎn)才能算出真正的端對端的延時(shí)。 音頻延時(shí)我們借助于音畫同步的偏差來計(jì)算,在接收到的序列中,通過特征音的查找找到對應(yīng)視頻的時(shí)間戳,他們的偏差就是音畫同步的偏差,音畫同步的偏差結(jié)合視頻的偏差就能算出音頻的偏差。

鼠標(biāo)點(diǎn)擊延時(shí)測試

除了端對端的延時(shí),在游戲中就是鼠標(biāo)響應(yīng)的時(shí)長。特別是在云游戲中,在客戶端開一槍,這一槍傳到服務(wù)器端最終相應(yīng)到客戶端的時(shí)間長度就是鼠標(biāo)的相應(yīng)時(shí)長。通常我們會(huì)在點(diǎn)擊鼠標(biāo)時(shí)刻記一個(gè)時(shí)間,然后將事件網(wǎng)絡(luò)傳輸?shù)椒?wù)端,服務(wù)端在進(jìn)行回傳的時(shí)候,真正相應(yīng)到客戶端中計(jì)算記錄時(shí)間(time2),time2減去之前鼠標(biāo)點(diǎn)擊的時(shí)間(time1)就是鼠標(biāo)來回的時(shí)間。在后續(xù),要根據(jù)不同的終端來做不同的處理,比如說瀏覽器可以借助Video Tag的event來做,其他終端可能要借助于視頻幀的檢測。

4. 系統(tǒng)性能評估輔助方法

在音視頻評估體系中,考慮到音視頻的質(zhì)量、音視頻的延時(shí)、音畫同步參數(shù)之外,我們還會(huì)對系統(tǒng)的性能進(jìn)行評估。我們整個(gè)通用中用了WebRTC,WebRTC stats其實(shí)提供了很多indicator,比如說fps、Bandwidth、幀率、幀大小、Nack cout、PacketLost等等因素。它其實(shí)也可以反饋給用戶系統(tǒng)的實(shí)時(shí)性能評估,我們?yōu)榱诵拚@些信號利用OpenCensus,它提供了不管是服務(wù)端C++還是用客戶端js來做,用Node js的后端,最后將所有的數(shù)據(jù)不管是WebRTC stats的或是音畫同步的信息還是音視頻質(zhì)量的時(shí)間信息統(tǒng)一傳輸?shù)胶蠖?,通過Prometheus終端顯示,這樣很多數(shù)據(jù)就可以做實(shí)時(shí)監(jiān)測的終端顯示,優(yōu)點(diǎn)就是不管你在哪里,通過一臺瀏覽器就可以監(jiān)控到目前的狀態(tài)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 音視頻
    +關(guān)注

    關(guān)注

    4

    文章

    452

    瀏覽量

    29783
  • 音視頻測試
    +關(guān)注

    關(guān)注

    0

    文章

    2

    瀏覽量

    5440

原文標(biāo)題:OWT(Open WebRTC Toolkit)云游戲自動(dòng)音視頻測試探索

文章出處:【微信號:livevideostack,微信公眾號:LiveVideoStack】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    盤點(diǎn)那些常見音視頻接口

    我們熟知的一些常見音視頻接口,發(fā)展至今在日常使用中已經(jīng)漸漸少了。但是在工業(yè)領(lǐng)域的音視頻連接,依然能看到其身影。這些看似消失的接口,它們現(xiàn)在發(fā)展成什么樣子了?本期我們將做一個(gè)大盤點(diǎn)。
    的頭像 發(fā)表于 09-09 14:34 ?181次閱讀

    常見音視頻接口的靜電浪涌防護(hù)和濾波方案

    音視頻接口在現(xiàn)代多媒體設(shè)備中扮演著至關(guān)重要的角色,它們確保了音視頻信號在不同設(shè)備間的順暢傳輸,各種類型的音視頻接口滿足了多樣化的應(yīng)用場景需求。 在音視頻接口的設(shè)計(jì)領(lǐng)域,靜電浪涌防護(hù)與濾
    的頭像 發(fā)表于 06-25 11:28 ?433次閱讀

    音視頻產(chǎn)品EMC整改案例解析

    音視頻產(chǎn)品EMCRE整改案例解析
    的頭像 發(fā)表于 05-20 16:49 ?248次閱讀
    <b class='flag-5'>音視頻</b>產(chǎn)品EMC整改案例解析

    高清HDMI轉(zhuǎn)USB 3.0音視頻多功能音采集卡-測評

    LCC380的設(shè)計(jì)理念在于全面考慮到各種用戶場景下的需求。為了實(shí)現(xiàn)高品質(zhì)的音視頻采集效果,卡體搭載了業(yè)界領(lǐng)先的音頻處理器解決方案。無論您是熱衷于游戲直播、視頻會(huì)議還是其他音視頻應(yīng)用,都
    的頭像 發(fā)表于 05-14 17:45 ?505次閱讀
    高清HDMI轉(zhuǎn)USB 3.0<b class='flag-5'>音視頻</b>多功能音采集卡-測評

    【RTC程序設(shè)計(jì):實(shí)時(shí)音視頻權(quán)威指南】音視頻的編解碼壓縮技術(shù)

    音視頻所載有的信息在通過傳輸?shù)臅r(shí)候就需要壓縮編碼。 其中,文本壓縮是指通過使用各種算法和技術(shù),將文本數(shù)據(jù)表示為更緊湊的形式,以減少存儲空間。 霍夫曼編碼是一種無損壓縮算法,它可以根據(jù)字符出現(xiàn)
    發(fā)表于 04-28 21:04

    音視頻SoC與AI技術(shù)融合,帶來更智能的音視頻處理解決方案

    電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)音視頻SoC,即音視頻系統(tǒng)級芯片或片上系統(tǒng),是一種高度集成化的芯片,它將電路板上的多塊芯片以及嵌入式軟件全部集成到一塊芯片中。音視頻SoC芯片廣泛應(yīng)用于各種嵌入式系統(tǒng)
    的頭像 發(fā)表于 04-26 01:20 ?3748次閱讀

    【RTC程序設(shè)計(jì):實(shí)時(shí)音視頻權(quán)威指南】音頻采集與預(yù)處理

    閑暇之余,繼續(xù)學(xué)習(xí)【RTC程序設(shè)計(jì):實(shí)時(shí)音視頻權(quán)威指南】這本書。 書中對于音頻采集的介紹非常詳細(xì)和全面,包括原理、方法、技術(shù)細(xì)節(jié)以及實(shí)踐應(yīng)用等方面的內(nèi)容。 音頻采集是實(shí)時(shí)音視頻通信中的關(guān)鍵步驟之一
    發(fā)表于 04-25 10:41

    【RTC程序設(shè)計(jì):實(shí)時(shí)音視頻權(quán)威指南】新書一瞥

    應(yīng)用,為開發(fā)者提供了完整的RTC解決方案。 首先RTC 是一個(gè)涉及音視頻編解碼、網(wǎng)絡(luò)傳輸、實(shí)時(shí)交互等多個(gè)領(lǐng)域的復(fù)雜技術(shù)。希望能通過這本書基礎(chǔ)知識開始,逐步深入到高級應(yīng)用和系統(tǒng)設(shè)計(jì)。 其次,RTC 技術(shù)為
    發(fā)表于 04-22 09:09

    感知音頻質(zhì)量分析POLQA測試方案

    本方案將由音視頻產(chǎn)品測試的發(fā)展歷程、POLQA介紹、POLQA測試方案及核心設(shè)備介紹四大方面介紹感知音頻質(zhì)量分析POLQA
    的頭像 發(fā)表于 04-18 16:44 ?793次閱讀
    感知音頻質(zhì)量<b class='flag-5'>分析</b>POLQA<b class='flag-5'>測試</b>方案

    音視頻解碼生成:打造極致觀影體驗(yàn)的關(guān)鍵技術(shù)

    在現(xiàn)代多媒體時(shí)代,音視頻解碼生成技術(shù)已成為提供極致觀影體驗(yàn)的核心要素。它不僅能夠確保音視頻數(shù)據(jù)的高效傳輸,還能保證播放的流暢性和畫質(zhì)清晰度,為用戶帶來身臨其境的觀影享受。 1. 解碼生成的重要性
    的頭像 發(fā)表于 02-25 14:43 ?348次閱讀

    音視頻解碼器優(yōu)化技巧:提升播放體驗(yàn)的關(guān)鍵步驟

    隨著數(shù)字多媒體內(nèi)容的爆炸式增長,音視頻解碼器在現(xiàn)代技術(shù)生活中扮演著至關(guān)重要的角色。流暢的在線視頻流播放到高質(zhì)量的本地文件解碼,解碼器的性能直接影響了我們的觀看體驗(yàn)。那么,如何優(yōu)化音視頻
    的頭像 發(fā)表于 02-21 14:45 ?580次閱讀

    音視頻解碼生成與流媒體傳輸?shù)慕Y(jié)合

    音視頻解碼生成與流媒體傳輸是現(xiàn)代數(shù)字媒體技術(shù)中兩個(gè)不可或缺的部分,它們的結(jié)合為用戶提供了高質(zhì)量、實(shí)時(shí)性的多媒體體驗(yàn)。 1. 解碼生成與流媒體傳輸?shù)年P(guān)系 解碼生成是流媒體傳輸?shù)那疤?。在流媒體服務(wù)中
    的頭像 發(fā)表于 02-21 14:36 ?278次閱讀

    音視頻

    音視頻技術(shù)都喜歡深究內(nèi)部最核心的原理和機(jī)制,尤其是ffmpeg這個(gè)編解碼庫,可以說是音視頻領(lǐng)域事實(shí)上的標(biāo)準(zhǔn)。語音智能算法,語言語義分析和理解,流媒體服務(wù)器等高端技術(shù)也都基于它而構(gòu)建。希望有幸獲得本書,深度學(xué)習(xí)ffmpeg核心技
    發(fā)表于 11-23 08:51

    ESP RTC音視頻傳輸延遲測試

    音視頻
    Kevincoooool
    發(fā)布于 :2023年11月11日 10:54:02

    HarmonyOS音視頻開發(fā)概述

    容器、音視頻編碼屬于內(nèi)容創(chuàng)作者所掌握的專業(yè)領(lǐng)域,不建議應(yīng)用開發(fā)者自制碼流進(jìn)行測試,以免產(chǎn)生無法播放、卡頓、花屏等兼容性問題。若發(fā)生此類問題不會(huì)影響系統(tǒng),退出播放即可。 支持的協(xié)議如下: 協(xié)議類型 協(xié)議
    發(fā)表于 10-17 16:39