0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

指標(biāo)監(jiān)控體系如何建設(shè)

數(shù)據(jù)分析與開發(fā) ? 來(lái)源:一個(gè)數(shù)據(jù)分析人的自留地 ? 作者: 圖圖 ? 2021-09-26 10:39 ? 次閱讀

對(duì)于數(shù)據(jù)人尤其是數(shù)據(jù)產(chǎn)品和分析師,最難排查(頭疼)的問(wèn)題就是指標(biāo)為什么升/降/沒(méi)數(shù),一旦業(yè)務(wù)方提出這種問(wèn)題就意味著有大半天的時(shí)間要花在確認(rèn)指標(biāo)口徑+計(jì)算邏輯+埋點(diǎn)采集上,而且要同時(shí)跟業(yè)務(wù)方、分析師、數(shù)據(jù)產(chǎn)品、數(shù)倉(cāng)甚至是負(fù)責(zé)埋點(diǎn)的開發(fā)溝通,所以對(duì)于業(yè)務(wù)達(dá)到一定復(fù)雜度和指標(biāo)達(dá)到一定量級(jí)的情況下,采用人肉運(yùn)維的方式顯然是事倍功半的,搭建一套指標(biāo)監(jiān)控體系來(lái)保證產(chǎn)出數(shù)據(jù)的時(shí)效性和數(shù)據(jù)質(zhì)量才是正解。

由于搭建指標(biāo)監(jiān)控體系要做的工作實(shí)在太多,本文我們重點(diǎn)討論幾個(gè)場(chǎng)景,在這些場(chǎng)景下我們數(shù)據(jù)產(chǎn)品經(jīng)理能夠發(fā)揮哪些作用。

以一個(gè)實(shí)際場(chǎng)景case舉例,聊聊當(dāng)數(shù)據(jù)出現(xiàn)異常波動(dòng)時(shí)監(jiān)控體系是如何發(fā)揮其作用的。

業(yè)務(wù)小李同學(xué)發(fā)現(xiàn),昨天App首頁(yè)的人均停留時(shí)長(zhǎng)日環(huán)比上漲了40%,于是小李找到分析師和數(shù)據(jù)產(chǎn)品詢問(wèn)指標(biāo)下降的原因。

此類問(wèn)題相信各位數(shù)據(jù)人都不陌生,大家的反應(yīng)都是先和業(yè)務(wù)確認(rèn)最近是否產(chǎn)品有過(guò)升級(jí)或者策略調(diào)整,如果沒(méi)有的話就要排查數(shù)據(jù)流轉(zhuǎn)的各個(gè)環(huán)節(jié)是否有問(wèn)題,以下圖為路線,我們分析在這些環(huán)節(jié)是否能前置的做些監(jiān)控和定位工作。

01

數(shù)據(jù)同步

不管是埋點(diǎn)數(shù)據(jù)和還是業(yè)務(wù)數(shù)據(jù),最終都是以一張張日志表的形式同步到數(shù)倉(cāng)ODS層,如果是數(shù)據(jù)同步有缺失,可以查看數(shù)據(jù)拉取服務(wù)、埋點(diǎn)日志解析、ETL等過(guò)程是否異常,可以將上述注意點(diǎn)整理一個(gè)checklist,做成任務(wù)每天例行檢查,能做到對(duì)以上異常情況的定位也就初步完成了數(shù)據(jù)同步環(huán)節(jié)的監(jiān)控。數(shù)倉(cāng)同學(xué)經(jīng)排查并未看到執(zhí)行失敗的任務(wù),可以確定數(shù)據(jù)同步環(huán)節(jié)是正常的。

02

調(diào)度監(jiān)控

其實(shí)調(diào)度監(jiān)控和任務(wù)管理有著很密切的聯(lián)系,最終目的都是為了把這些任務(wù)有序的運(yùn)行起來(lái),調(diào)度系統(tǒng)的設(shè)計(jì)可以重點(diǎn)考慮以下幾個(gè)特性:

98debede-1245-11ec-8fb8-12bb97331649.jpg

那么如何通過(guò)產(chǎn)品化的形式展示當(dāng)前任務(wù)的調(diào)度狀態(tài)呢?一般大家都會(huì)選擇用血脈圖來(lái)展示,數(shù)據(jù)產(chǎn)品在設(shè)計(jì)血脈圖的展現(xiàn)形式時(shí),可以考慮不僅能展示作業(yè)組、節(jié)點(diǎn)、表名、字段名、運(yùn)行狀態(tài)等,還要考慮能將業(yè)務(wù)實(shí)體,也就是指標(biāo)與調(diào)度信息進(jìn)行關(guān)聯(lián)。 當(dāng)然能做到這個(gè)粒度依托與數(shù)倉(cāng)治理的程度,如果數(shù)倉(cāng)規(guī)范和治理做的沒(méi)那么精細(xì),我們可以抓重點(diǎn)來(lái)做:比如梳理一些重要指標(biāo)的調(diào)度關(guān)系,先把這些重要指標(biāo)的調(diào)度監(jiān)控做起來(lái),這樣也是比較容易看到成效的。

此時(shí)我們查看血脈圖可以看到總停留時(shí)長(zhǎng)這個(gè)指標(biāo)是執(zhí)行成功狀態(tài),且依賴的作業(yè)也是執(zhí)行成功的狀態(tài),而我們要排查的人均停留時(shí)長(zhǎng)指標(biāo)是總停留時(shí)長(zhǎng)指標(biāo)的派生指標(biāo),這樣我們可以得出結(jié)論并非是調(diào)度任務(wù)出現(xiàn)問(wèn)題,接下來(lái)可以排查是否是運(yùn)行指標(biāo)的任務(wù)出了問(wèn)題。

03

任務(wù)管理

看到這兒會(huì)發(fā)現(xiàn)我們?cè)絹?lái)越接近指標(biāo)層了,而隨著指標(biāo)數(shù)量越來(lái)越多、指標(biāo)口徑越來(lái)越復(fù)雜,就會(huì)出現(xiàn)下面令人頭疼的問(wèn)題:

----任務(wù)不能在計(jì)劃時(shí)間內(nèi)完成

----下游依賴的任務(wù)已經(jīng)執(zhí)行了但上游任務(wù)還沒(méi)跑完,這時(shí)候沒(méi)有數(shù)據(jù)下游任務(wù)報(bào)錯(cuò)

----兩個(gè)任務(wù)并行執(zhí)行影響數(shù)據(jù)結(jié)果

排查任務(wù)錯(cuò)誤原因越來(lái)越麻煩、各種依賴關(guān)系越來(lái)越復(fù)雜、最后排查問(wèn)題就要從一團(tuán)團(tuán)亂麻中理出已跟麻繩。

而為了保證指標(biāo)產(chǎn)出的準(zhǔn)確性,就必須要求生成這些指標(biāo)的任務(wù)按照上下游依賴有序進(jìn)行,最終能確保按時(shí)生成指標(biāo)。

為了保證指標(biāo)產(chǎn)出的監(jiān)控性,要做到對(duì)導(dǎo)入任務(wù)的監(jiān)控,具體有支持查看導(dǎo)入任務(wù)的執(zhí)行紀(jì)錄、執(zhí)行狀態(tài)、失敗原因等,這樣當(dāng)指標(biāo)數(shù)據(jù)未產(chǎn)出時(shí)可以通過(guò)導(dǎo)入任務(wù)的執(zhí)行狀態(tài)來(lái)分析問(wèn)題。

而為了保證指標(biāo)的時(shí)效性我們可以配置指標(biāo)負(fù)責(zé)人、運(yùn)維人員、SLA來(lái)保證,當(dāng)任務(wù)執(zhí)行時(shí)間超過(guò)SLA觸發(fā)報(bào)警機(jī)制。

接下來(lái)回到我們排查人均停留時(shí)長(zhǎng)這個(gè)問(wèn)題,已知他的原子指標(biāo)總停留時(shí)長(zhǎng)的作業(yè)是沒(méi)問(wèn)題的,那么我們分析這個(gè)指標(biāo)的計(jì)算邏輯:

人均停留時(shí)長(zhǎng)=總停留時(shí)長(zhǎng)/DAU

我們看到上游產(chǎn)出DAU的任務(wù)失敗了,后經(jīng)開發(fā)排查,是因?yàn)镈AU的表里有個(gè)小時(shí)表執(zhí)行失敗了,導(dǎo)致DAU算的數(shù)據(jù)偏少,進(jìn)而人均停留時(shí)長(zhǎng)數(shù)據(jù)異常增長(zhǎng)。

04

指標(biāo)檢驗(yàn)

最后就是對(duì)指標(biāo)數(shù)據(jù)進(jìn)行檢驗(yàn),在導(dǎo)入任務(wù)執(zhí)行完產(chǎn)出數(shù)據(jù)后,如何驗(yàn)證產(chǎn)出的數(shù)據(jù)符合預(yù)期呢?我們可以給指標(biāo)的波動(dòng)范圍設(shè)計(jì)閾值(一般是日環(huán)比和周同比的形式),關(guān)于閾值如何設(shè)定,有的團(tuán)隊(duì)可能采用業(yè)務(wù)方提供的波動(dòng)值來(lái)作為閾值,但這種判斷容易受主觀思維影響,從數(shù)據(jù)的角度出發(fā)可以考慮取以往的指標(biāo)波動(dòng)均值作為參考閾值,這樣我們?cè)陂撝档脑O(shè)定上是比較科學(xué)的。

如果是業(yè)務(wù)調(diào)整帶來(lái)的波動(dòng),那在計(jì)劃調(diào)整的時(shí)候肯定是有個(gè)預(yù)期的波動(dòng)值,我們只需要在調(diào)整后及時(shí)在報(bào)表展示平臺(tái)添加好提示,同時(shí)也檢查下數(shù)據(jù)波動(dòng)和業(yè)務(wù)的預(yù)期是否一致,這樣也會(huì)降低一些因業(yè)務(wù)調(diào)整帶來(lái)的口徑波動(dòng)解釋成本

在指標(biāo)校驗(yàn)環(huán)節(jié)我們發(fā)現(xiàn)人均停留時(shí)長(zhǎng)這個(gè)指標(biāo)已經(jīng)超過(guò)了設(shè)置的20%的閾值,所以業(yè)務(wù)同學(xué)收到了報(bào)警,然后就開始了我們文章一開始出現(xiàn)的那一幕。

指標(biāo)監(jiān)控體系看似是對(duì)指標(biāo)的監(jiān)控,實(shí)際上是對(duì)整個(gè)數(shù)據(jù)生產(chǎn)流程的監(jiān)控,但本文只是簡(jiǎn)單的講了這幾個(gè)環(huán)節(jié),排查實(shí)際問(wèn)題中并不只是這些環(huán)節(jié)會(huì)有問(wèn)題,比如數(shù)據(jù)同步環(huán)節(jié)發(fā)現(xiàn)解析到的埋點(diǎn)日志很少,那么我們要排查是否埋點(diǎn)出現(xiàn)異常;調(diào)度監(jiān)控除了血脈圖還有元數(shù)據(jù)管理平臺(tái)等等。。。

總之?dāng)?shù)據(jù)采集到數(shù)據(jù)可視化是個(gè)漫長(zhǎng)且復(fù)雜的鏈路,對(duì)于企業(yè)級(jí)的指標(biāo)監(jiān)控系統(tǒng),這些事還遠(yuǎn)遠(yuǎn)不夠,不同公司面臨的困難不一樣,方法也不一樣,思考如何制定適合自己業(yè)務(wù)和技術(shù)現(xiàn)狀的監(jiān)控方案,這樣才能更好的落地實(shí)施。

編輯:jq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 數(shù)據(jù)
    +關(guān)注

    關(guān)注

    8

    文章

    6820

    瀏覽量

    88747
  • APP
    APP
    +關(guān)注

    關(guān)注

    33

    文章

    1566

    瀏覽量

    72334
  • SLA
    SLA
    +關(guān)注

    關(guān)注

    1

    文章

    54

    瀏覽量

    18248

原文標(biāo)題:淺談如何建設(shè)指標(biāo)監(jiān)控體系

文章出處:【微信號(hào):DBDevs,微信公眾號(hào):數(shù)據(jù)分析與開發(fā)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    智慧園區(qū)建設(shè),構(gòu)建智能監(jiān)控和安防體系

    智慧樓宇是智慧園區(qū)建設(shè)的核心要素之一。通過(guò)引入智能化設(shè)備和系統(tǒng),如智能門禁、智能電表、智能照明等,實(shí)現(xiàn)對(duì)樓宇內(nèi)部各項(xiàng)設(shè)施和資源的智能化管理和控制。智慧樓宇利用物聯(lián)網(wǎng)技術(shù)和大數(shù)據(jù)分析,可以實(shí)現(xiàn)對(duì)樓宇
    的頭像 發(fā)表于 09-27 15:25 ?192次閱讀

    助力企業(yè)數(shù)字化轉(zhuǎn)型,數(shù)勢(shì)科技發(fā)布行業(yè)首部指標(biāo)管理專著!

    的行業(yè)首部指標(biāo)體系、指標(biāo)平臺(tái)專業(yè)書籍《指標(biāo)體系指標(biāo)平臺(tái):方法論與實(shí)踐》,引來(lái)各界高度關(guān)注。 《指標(biāo)體系
    的頭像 發(fā)表于 07-19 17:42 ?241次閱讀

    上位監(jiān)控程序如何實(shí)現(xiàn)

    之前,需要對(duì)目標(biāo)系統(tǒng)進(jìn)行需求分析,明確監(jiān)控對(duì)象、監(jiān)控指標(biāo)、用戶需求和系統(tǒng)性能要求。以下是一些關(guān)鍵需求: 1.1 監(jiān)控對(duì)象:確定需要監(jiān)控的設(shè)備
    的頭像 發(fā)表于 06-07 09:12 ?404次閱讀

    利用ThingsBoard網(wǎng)關(guān)實(shí)現(xiàn)智慧城市遠(yuǎn)程監(jiān)控

    城市是推進(jìn)數(shù)字中國(guó)建設(shè)的綜合載體,推進(jìn)城市數(shù)字化轉(zhuǎn)型、智慧化發(fā)展,是面向未來(lái)構(gòu)筑城市競(jìng)爭(zhēng)新優(yōu)勢(shì)的關(guān)鍵之舉,也是推動(dòng)城市治理體系和治理能力現(xiàn)代化的必然要求。 加快智慧城市建設(shè)步伐,構(gòu)建城市運(yùn)行和治理
    的頭像 發(fā)表于 05-27 15:09 ?740次閱讀

    淺談智能機(jī)器人智能電表運(yùn)維管理體系在鐵路牽引變電所建設(shè)構(gòu)想

    淺談智能機(jī)器人智能電表運(yùn)維管理體系在鐵路牽引變電所建設(shè)構(gòu)想 張穎姣 安科瑞電氣股份有限公司 上海嘉定201801 摘要:本文針對(duì)鐵路牽引變電所智能化建設(shè)面臨數(shù)字化、信息化、智能化應(yīng)用不足問(wèn)題進(jìn)行闡述
    的頭像 發(fā)表于 04-15 16:25 ?278次閱讀
    淺談智能機(jī)器人智能電表運(yùn)維管理<b class='flag-5'>體系</b>在鐵路牽引變電所<b class='flag-5'>建設(shè)</b>構(gòu)想

    淺談電氣火災(zāi)監(jiān)控系統(tǒng)在智慧消防建設(shè)中的應(yīng)用與產(chǎn)品選型

    淺談電氣火災(zāi)監(jiān)控系統(tǒng)在智慧消防建設(shè)中的應(yīng)用與產(chǎn)品選型 張穎姣 安科瑞電氣股份有限公司?上海嘉定201801 摘要:針對(duì)電氣火災(zāi)事故進(jìn)行預(yù)先測(cè)算與報(bào)警,并在出現(xiàn)問(wèn)題時(shí)及時(shí)開展救助。目前在電氣系統(tǒng)中已
    的頭像 發(fā)表于 04-11 16:40 ?254次閱讀
    淺談電氣火災(zāi)<b class='flag-5'>監(jiān)控</b>系統(tǒng)在智慧消防<b class='flag-5'>建設(shè)</b>中的應(yīng)用與產(chǎn)品選型

    基于訊維技術(shù)的城市治安監(jiān)控系統(tǒng)分布式智慧終端建設(shè)

    基于訊維技術(shù)的城市治安監(jiān)控系統(tǒng)分布式智慧終端建設(shè),為現(xiàn)代城市的治安管理帶來(lái)了革命性的改變。這種創(chuàng)新的應(yīng)用不僅提升了治安管理的效率和準(zhǔn)確性,還進(jìn)一步保障了市民的安全和城市的穩(wěn)定。 首先,訊維技術(shù)
    的頭像 發(fā)表于 04-08 15:31 ?438次閱讀

    分布式智慧終端在水利工程建設(shè)中的實(shí)時(shí)監(jiān)控解決方案

    訊維分布式智慧終端在水利工程建設(shè)中的實(shí)時(shí)監(jiān)控解決方案,旨在通過(guò)集成先進(jìn)的監(jiān)控技術(shù)和智能化管理手段,實(shí)現(xiàn)對(duì)水利工程建設(shè)過(guò)程的全面、實(shí)時(shí)、高效監(jiān)控
    的頭像 發(fā)表于 04-08 15:16 ?322次閱讀

    訊維融合處理器助力智慧城市建設(shè):綜合監(jiān)控系統(tǒng)工程案例

    隨著城市化進(jìn)程的加速推進(jìn),智慧城市建設(shè)已成為提升城市管理效能、增強(qiáng)城市綜合競(jìng)爭(zhēng)力的重要手段。綜合監(jiān)控系統(tǒng)作為智慧城市的重要組成部分,對(duì)于提高城市安全、保障市民生活具有至關(guān)重要的作用。在這一背景下,訊
    的頭像 發(fā)表于 04-01 16:33 ?339次閱讀

    國(guó)能局發(fā)布煤礦智能化標(biāo)準(zhǔn)體系建設(shè)指南,設(shè)定2025年目標(biāo)

    建設(shè)指南》進(jìn)一步指出,預(yù)計(jì)至2030年,該標(biāo)準(zhǔn)體系將更為完善,在煤礦各環(huán)節(jié)如設(shè)計(jì)、建井、生產(chǎn)、管理、運(yùn)維、評(píng)價(jià)等環(huán)節(jié)都形成完善的制度標(biāo)準(zhǔn)。
    的頭像 發(fā)表于 03-25 13:45 ?440次閱讀

    什么是智慧監(jiān)控?

    THEIntelligentMonitoring什么是智慧監(jiān)控?成都華江信息技術(shù)有限公司隨著社會(huì)的進(jìn)步,科技不斷發(fā)展、監(jiān)控體系也在迭代升級(jí),如今的監(jiān)控技術(shù)已今非昔比,能獨(dú)自完成智能化操
    的頭像 發(fā)表于 02-19 12:43 ?732次閱讀
    什么是智慧<b class='flag-5'>監(jiān)控</b>?

    工信部印發(fā)《國(guó)家汽車芯片標(biāo)準(zhǔn)體系建設(shè)指南》

    工業(yè)和信息化部近日印發(fā)的《國(guó)家汽車芯片標(biāo)準(zhǔn)體系建設(shè)指南》(以下簡(jiǎn)稱《指南》)提出,將根據(jù)汽車芯片技術(shù)現(xiàn)狀、產(chǎn)業(yè)應(yīng)用需要及未來(lái)發(fā)展趨勢(shì),分階段建立健全標(biāo)準(zhǔn)體系,加大力量?jī)?yōu)先制定基礎(chǔ)、共性及重點(diǎn)產(chǎn)品等
    的頭像 發(fā)表于 01-17 17:59 ?296次閱讀

    工信部:50余項(xiàng)云計(jì)算標(biāo)準(zhǔn)化體系建設(shè)指南發(fā)布,推進(jìn)云計(jì)算行業(yè)發(fā)展

    根據(jù)《云計(jì)算綜合標(biāo)準(zhǔn)化體系建設(shè)指南》所述,有關(guān)部門計(jì)劃在明年繼續(xù)完善云計(jì)算標(biāo)準(zhǔn)體系,包括修訂參考架構(gòu)和術(shù)語(yǔ)等基礎(chǔ)標(biāo)準(zhǔn),優(yōu)先制定云計(jì)算創(chuàng)新型技術(shù)及產(chǎn)品、新式服務(wù)應(yīng)用以及部分關(guān)鍵領(lǐng)域的標(biāo)準(zhǔn)。
    的頭像 發(fā)表于 01-10 15:00 ?717次閱讀

    某市配網(wǎng)配電室環(huán)境智能監(jiān)控系統(tǒng)建設(shè)探索與實(shí)踐分析

    摘要: 配電室內(nèi)溫濕度等環(huán)境因素直接影響到室內(nèi)設(shè)備的安全可靠運(yùn)行,結(jié)合某市配網(wǎng)配電室管理現(xiàn)狀介紹了環(huán)境智能監(jiān)控系統(tǒng)建設(shè)的可行性,詳細(xì)閘述了系統(tǒng)試點(diǎn)建設(shè)方案。實(shí)踐證明該方案實(shí)現(xiàn)了配電室運(yùn)行環(huán)境實(shí)時(shí)監(jiān)測(cè)
    發(fā)表于 01-09 16:30

    《國(guó)家汽車芯片標(biāo)準(zhǔn)體系建設(shè)指南》發(fā)布,推動(dòng)芯片研發(fā)與應(yīng)用

     該指南表示,計(jì)劃按階段建設(shè)完整的汽車芯片標(biāo)準(zhǔn)體系,優(yōu)先制定急需的基礎(chǔ)、共性及重點(diǎn)產(chǎn)品標(biāo)準(zhǔn),隨后依據(jù)技術(shù)成熟度,逐漸制定產(chǎn)品應(yīng)用和匹配實(shí)驗(yàn)標(biāo)準(zhǔn)。預(yù)計(jì)截至2025年,完成超過(guò)30項(xiàng)重要的汽車芯片標(biāo)準(zhǔn)制定
    的頭像 發(fā)表于 01-09 11:42 ?443次閱讀