什么是大劇保障?
優(yōu)酷大劇保障主要是對大劇、大綜等節(jié)目視頻上線前和上線后進行質(zhì)量保障。大劇視頻上線所涉及方很多:比如播放(類似報錯、卡住、黑屏、聲音等問題)、付費權(quán)益、運營配置、用戶輿情反饋是否正常等。
總的來說,優(yōu)酷大劇保障主要是在大劇大綜開播前、開播后對視頻進行質(zhì)量保障,及時發(fā)現(xiàn)問題并解決,避免資損和客訴,使用戶有更好的觀影體驗。
如何保障?
大劇保障基本涵蓋了大劇生命周期的全鏈路各個階段保障,其中核心環(huán)節(jié)包括以下方面:
針對圖中的各階段,我們建設(shè)了大劇上線流程中需要保障的環(huán)節(jié)以及能力:
1. 視頻生產(chǎn)
視頻生產(chǎn)環(huán)節(jié)保障包括片源質(zhì)量、上傳轉(zhuǎn)碼質(zhì)量等維度,主要以視頻質(zhì)量檢測為主:1)介質(zhì)到位時間,在上線前 24 小時檢查介質(zhì)是否到位;
介質(zhì)質(zhì)量,采用機檢和人工檢查兩種方式進行,保證片源正常;
上傳轉(zhuǎn)碼耗時評估,重點關(guān)注開播前轉(zhuǎn)碼完成情況;
轉(zhuǎn)碼完成的流會自動進入視頻質(zhì)量檢測,檢測其聲音、畫質(zhì)、數(shù)據(jù)等;
直播流生產(chǎn)場景,主要檢測源流規(guī)格、流穩(wěn)定性等源流質(zhì)量,錄制過程中關(guān)注負載、排 隊、耗時、畫質(zhì)等。
2. 運營管理
視頻、節(jié)目播控策略檢測及實時監(jiān)控;
媒資數(shù)據(jù)檢查,如廣告點位、編目、其他重要字段,實時變化通知。
3. 權(quán)益管理
付費會員是視頻網(wǎng)站的重要上帝用戶,保證會員權(quán)益重中之重:1)會員可看視頻的會員權(quán)益正確;
付費點播的交易、權(quán)益正確;
視頻相關(guān)付費屬性的校驗和實時監(jiān)控。
4.播放環(huán)節(jié)
播放環(huán)節(jié)是最主要的環(huán)節(jié)。以前有個痛點:視頻在開播前是屏蔽狀態(tài),無法提前通過前端 播放,只能等開播后到線上觀看,如果有問題則為時已晚。為了解決這個問題,我們建設(shè)了播 放預覽能力:
播放提供預覽環(huán)境,可以播放未上線的視頻,同時與線上真實場景保持一致的會員權(quán)益、 廣告、播放策略等,保證上線前可以模擬上線后的真實數(shù)據(jù);
同時優(yōu)酷提供 APP、PC 等客戶端預覽環(huán)境,得以在各端驗證播放效果。
另外,我們也將播放自動化測試能力賦能在播放環(huán)節(jié),比如接口自動化測試、播放器自動 化測試。
5.線上監(jiān)控
上線之后,除了有全量的播放監(jiān)控,也有針對大劇建立了相應(yīng)指標監(jiān)控和報警,如播放 成功率、卡頓率等;
對彈幕評論、客訴反饋、社會輿情中的信息,建立了實時監(jiān)控,發(fā)現(xiàn)問題及時響應(yīng)排查。
大劇保障平臺
圍繞以上各環(huán)節(jié),我們建立了大劇保障平臺,提供自動或人工的檢測機制,并有相關(guān)變更 和事件的通知觸達能力。
下圖是我們覆蓋到的業(yè)務(wù)以及相關(guān)的功能。
1.大劇管理
我們會將重要級別的劇集自動或手動方式錄入到大劇保障平臺,平臺將自動拉取節(jié)目下的 正片視頻、介質(zhì),上線時間等信息,大劇保障將圍繞上線時間展開一系列的保障。
2.服務(wù)管控
大劇上線期間,相關(guān)信息第一時間同步給各環(huán)節(jié)服務(wù)方,核心應(yīng)用避免在大劇上線期間發(fā) 布,如有服務(wù)發(fā)布或變更出現(xiàn)問題,第一時間回滾,避免問題擴大化。為了避免大劇上線期間 因服務(wù)發(fā)布產(chǎn)生的問題,我們制定了服務(wù)管控規(guī)則:
1)大劇上線期間禁止相關(guān)業(yè)務(wù)發(fā)布變更,會在開播前機器人通知所有人;
2)熱度比較高的劇,實施封網(wǎng)管控。
3.問題觸達
建立大劇保障釘釘群,將所有相關(guān)業(yè)務(wù)方技術(shù)、產(chǎn)品、運營等同學集中到一起,并配置機 器人用于發(fā)送報警通知。系統(tǒng)支持訂閱大劇重要字段的變更通知,實時監(jiān)聽正片的各個字段變 化,有異常則報警通知。同時將各個業(yè)務(wù)方已有的保障和報警能力接入進來。
檢測預警消息接入后,各環(huán)節(jié)消息非常多,重要消息有可能會被忽略,那如何優(yōu)化消息觸 達,不錯過重要異常信息呢?通過持續(xù)建立和優(yōu)化機器判斷的能力,重要異常情況發(fā)送報警并 精準觸達到指定人。同時我們會存儲以上所有操作變更記錄和時間點,用于快速排查問題。
4. 機器和人工保障
1)系統(tǒng)自動執(zhí)行各個環(huán)節(jié)的機器檢測,并提供人工 check 機制,雙重保障;
2)上線前實時的檢測以及結(jié)果直觀的展示;
3)上線前 24 小時播報檢測情況,比如在上線前的 12 小時、4 小時、1 小時播報當前檢測 狀態(tài)。這樣不僅讓各方知曉即將上線劇集,也了解各個業(yè)務(wù)的檢查狀況。
5.線上監(jiān)控
1)上線后的實時彈幕評論預警,客訴預警。其中我們在彈幕評論這塊做到了自動化過濾關(guān) 鍵字來實時報警,這也是比較準確和及時的輿情來源;
2)上線后的播放質(zhì)量監(jiān)控。監(jiān)控各端播放卡頓、成功率、錯誤數(shù)等情況,及時關(guān)注各端播 放情況。
6.應(yīng)急預案
大劇建設(shè)了發(fā)現(xiàn)問題的能力,也要有應(yīng)對快速止血的機制。我們確定了出現(xiàn)問題時的預案 項以及相關(guān)人員,保證問題第一時間準確的傳達和快速止血,保證及時止損和問題快速修復, 減少對用戶的影響。
總結(jié)
通過以上大劇保障能力的建設(shè),我們在一個平臺上可以直觀的看到每部大劇在上線前各個 環(huán)節(jié)的健康狀態(tài),異常變動有預警通知,有線上的穩(wěn)定性監(jiān)控以及輿情監(jiān)控,線上問題有相對應(yīng)的快速止血策略,整個保障鏈路形成閉環(huán)。目前平臺相關(guān)能力仍在持續(xù)建設(shè)中,橫向我們將 覆蓋更多的相關(guān)聯(lián)業(yè)務(wù)方,縱向?qū)⒊掷m(xù)細化和加強每個業(yè)務(wù)方的保障能力。我們的目標是向著自動化、智能化發(fā)展,無人值守,做到上線前“心里有底”,上線后“心里不慌”。
-
監(jiān)控系統(tǒng)
+關(guān)注
關(guān)注
21文章
3848瀏覽量
173440 -
人工檢測
+關(guān)注
關(guān)注
0文章
9瀏覽量
10698 -
優(yōu)酷
+關(guān)注
關(guān)注
0文章
13瀏覽量
9917
發(fā)布評論請先 登錄
相關(guān)推薦
評論