0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

FreeWheel基于機(jī)器學(xué)習(xí)的業(yè)務(wù)異常檢測(cè)實(shí)踐

jf_WZTOguxH ? 來源:鐘雨 ? 作者:鐘雨 ? 2022-10-28 14:35 ? 次閱讀

背 景

公司運(yùn)行過程中,尤其是對(duì)于偏重?cái)?shù)據(jù)的互聯(lián)網(wǎng)公司,業(yè)務(wù)異常檢測(cè)是一個(gè)非常重要但又很容易被輕視的工作。一旦因?yàn)闃I(yè)務(wù)發(fā)生異常并且沒有被及時(shí)發(fā)現(xiàn),一定會(huì)對(duì)公司和客戶產(chǎn)生某種程度的損失,從而影響業(yè)務(wù)正常發(fā)展。很多公司都構(gòu)建了基于規(guī)則的報(bào)警平臺(tái),并將其應(yīng)用于業(yè)務(wù)的異常檢測(cè)。但由于數(shù)據(jù)模式的快速變化,并且數(shù)據(jù)中存在著大量噪音,基于規(guī)則的異常檢測(cè)誤報(bào)率較高?;?a href="http://www.ttokpm.com/v/tag/557/" target="_blank">機(jī)器學(xué)習(xí)人工智能的業(yè)務(wù)異常檢測(cè)可以獲得比傳統(tǒng)規(guī)則系統(tǒng)更高的準(zhǔn)確率和擴(kuò)展性,但由于面臨諸如異常的定義較為模糊、缺少數(shù)據(jù)標(biāo)簽等諸多挑戰(zhàn),構(gòu)建一個(gè)實(shí)用的業(yè)務(wù)異常檢測(cè)系統(tǒng)需要算法工程師和數(shù)據(jù)開發(fā)工程師的精雕細(xì)琢才能完成。

FreeWheel 是一家數(shù)字廣告管理技術(shù)和服務(wù)提供商,創(chuàng)建于 2007 年,是一家專門提供電視及互聯(lián)網(wǎng)視頻廣告投放、監(jiān)測(cè)、預(yù)測(cè)、增值等關(guān)鍵解決方案的技術(shù)公司,主營(yíng)業(yè)務(wù)為高端視頻媒體的廣告服務(wù)。為客戶提供穩(wěn)定可靠的廣告投放服務(wù)是 FreeWheel 的宗旨,為了提高服務(wù)質(zhì)量,對(duì)業(yè)務(wù)的異常檢測(cè)和預(yù)警非常關(guān)鍵。我們從 2020 年開始從零打造了基于機(jī)器學(xué)習(xí)的業(yè)務(wù)異常檢測(cè)系統(tǒng),覆蓋了 FreeWheel 核心業(yè)務(wù)指標(biāo),為客戶的廣告投放保駕護(hù)航。

本文介紹了 FreeWheel 基于機(jī)器學(xué)習(xí)的業(yè)務(wù)異常檢測(cè)實(shí)踐,提煉了從零開始構(gòu)建業(yè)務(wù)異常檢測(cè)系統(tǒng)面臨的問題和解決方案,文章介紹了常用的異常檢測(cè)算法,比較了不同算法模型的優(yōu)劣,介紹了可擴(kuò)展的異常檢測(cè)系統(tǒng)是如何搭建的,希望對(duì)于從事相關(guān)工作的朋友能夠帶來幫助。

異常檢測(cè)概述

從應(yīng)用場(chǎng)景分,異常檢測(cè)包括指標(biāo)異常檢測(cè)、日志異常檢測(cè)、網(wǎng)絡(luò)異常檢測(cè)、用戶行為異常檢測(cè)(風(fēng)控、反作弊)等。從數(shù)據(jù)角度又可以分為新奇點(diǎn)檢測(cè) (Novelty Detection) 和離群點(diǎn)檢測(cè) (Outlier Detection)。

廣告業(yè)務(wù)異常檢測(cè)是以業(yè)務(wù)指標(biāo)為基礎(chǔ),多維度、多角度的異常檢測(cè)。一方面,業(yè)務(wù)指標(biāo)是連續(xù)采集的時(shí)間序列,通常認(rèn)為歷史序列是正常的,從中學(xué)習(xí)特定的模式,未來的指標(biāo)如果違反了這個(gè)模式,可以認(rèn)為出現(xiàn)了異常,從這個(gè)角度看,屬于新奇點(diǎn)檢測(cè)的范疇。另一方面,業(yè)務(wù)指標(biāo)在某幾個(gè)維度下的值一般會(huì)滿足某種分布,和多數(shù)正常值相比差別比較大的可能就是異常點(diǎn),這屬于離群點(diǎn)檢測(cè)的范疇。受篇幅所限,本文主要關(guān)注新奇點(diǎn)檢測(cè)問題,離群點(diǎn)檢測(cè)的相關(guān)實(shí)踐將在后續(xù)分享。

異常檢測(cè)面臨諸多挑戰(zhàn),第一,正常和異常的邊界是非常模糊的,很多時(shí)候是“公說公有理,婆說婆有理”;第二,歷史數(shù)據(jù)里經(jīng)常包括很多噪音,甚至歷史數(shù)據(jù)中就存在著異常。第三,幾乎沒有標(biāo)注的異常標(biāo)簽;第四,正常數(shù)據(jù)的模式也不是一成不變的,會(huì)隨著時(shí)間的推移和業(yè)務(wù)的演進(jìn)發(fā)生很大的變化。指標(biāo)異常檢測(cè)算法,包括無監(jiān)督、半監(jiān)督、監(jiān)督機(jī)器學(xué)習(xí)算法。其中以無監(jiān)督應(yīng)用最為廣泛。無監(jiān)督主要有基于統(tǒng)計(jì)模型的異常檢測(cè)(如 EVT),基于時(shí)間序列預(yù)測(cè)的異常檢測(cè),基于隱變量重構(gòu)誤差的異常檢測(cè)(如 VAE),以及其他深度學(xué)習(xí)的衍生模型(如 AnomalyTransformer) 等。監(jiān)督的算法更偏向于傳統(tǒng)的機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的分類模型,半監(jiān)督方法致力于解決標(biāo)簽數(shù)據(jù)不足的問題,提高監(jiān)督方法的學(xué)習(xí)效果。本文主要介紹我們從零到一的實(shí)踐經(jīng)驗(yàn)和在生產(chǎn)環(huán)境中應(yīng)用較為成熟的算法模型,除此之外,基于監(jiān)督和半監(jiān)督方法的模型也很快投入生產(chǎn)環(huán)境,期待后面分享給大家。

業(yè)務(wù)指標(biāo)監(jiān)控

FreeWheel 監(jiān)控平臺(tái)目前有兩大指標(biāo)數(shù)據(jù)來源,Prometheus 和數(shù)據(jù)平臺(tái)。Prometheus 是目前主流的開源監(jiān)控解決方案,具有數(shù)據(jù)模型靈活、延遲低等特點(diǎn),目前存儲(chǔ) FreeWheel 絕大多數(shù)系統(tǒng)和應(yīng)用指標(biāo)和核心業(yè)務(wù)指標(biāo)。Prometheus 的核心業(yè)務(wù)指標(biāo)是從 Ad Server 直接采集而來,如請(qǐng)求量、廣告曝光量等,聚合粒度較粗。另一部分來源于 FreeWheel 數(shù)據(jù)平臺(tái),通過對(duì) AdServer 產(chǎn)生的廣告日志的實(shí)時(shí)處理,將更細(xì)粒度的指標(biāo)存入 Druid,其數(shù)據(jù)延遲為分鐘級(jí)。有了細(xì)粒度的數(shù)據(jù)后,我們可以基于我們關(guān)心的維度進(jìn)行實(shí)時(shí)聚合,如廣告曝光量這個(gè)指標(biāo),根據(jù)客戶 ID 進(jìn)行聚合,可以對(duì)每個(gè)客戶 ID 的廣告曝光量時(shí)間序列進(jìn)行異常檢測(cè)和報(bào)警。

快速搭建 V1.0 系統(tǒng)

最早的時(shí)候,我們通過規(guī)則的方式對(duì)幾個(gè)關(guān)鍵的指標(biāo)配置了預(yù)警,比如,某個(gè)重要客戶的曝光量或者轉(zhuǎn)化率小于某個(gè)閾值就會(huì)觸發(fā)報(bào)警;比如針對(duì)所有的站點(diǎn),若流量同環(huán)比小于 80%,就認(rèn)為可能有問題。這些規(guī)則確實(shí)起到了一定的作用,也檢測(cè)到了很多異常,但缺點(diǎn)也很明顯:第一是規(guī)則太多,不同客戶的業(yè)務(wù)和流量模式千差萬別,同一套閾值比較難以滿足需求;第二點(diǎn)是業(yè)務(wù)變化很快,閾值需要隨著業(yè)務(wù)變化不斷地調(diào)整,維護(hù)成本高;第三點(diǎn),也是最大的痛點(diǎn)是誤報(bào)率大,需要耗費(fèi)大量的人工處理報(bào)警。

為了從零開始快速搭建起基于機(jī)器學(xué)習(xí)的 V1.0 的異常檢測(cè)系統(tǒng),我們采用了簡(jiǎn)單直接的做法,基于歷史數(shù)據(jù)訓(xùn)練回歸模型,預(yù)測(cè)未來的指標(biāo)和對(duì)應(yīng)的上下界,如果真實(shí)值超過了上下界,則檢測(cè)到異常并觸發(fā)報(bào)警,也就是基于時(shí)間序列預(yù)測(cè)的異常檢測(cè)。

66d7c578-567f-11ed-a3b6-dac502259ad0.png

(注:綠色實(shí)線時(shí)指標(biāo)的真實(shí)值,藍(lán)色虛線是指標(biāo)的預(yù)測(cè)值,橙色和紅色分別是上下屆,紅框標(biāo)注的是檢測(cè)到的異常)

第一版模型 ARIMA

首先,為了能快速上線第一個(gè)版本,我們嘗試了時(shí)間序列預(yù)測(cè)里最常用的 ARIMA 模型,ARIMA 是 Autoregressive Integrated Moving Average model 的縮寫。ARIMA 模型有三個(gè)超參數(shù) p,d,q,一般寫作 ARIMA(p,d,q) 中,AR 是“自回歸”,p 為自回歸項(xiàng)數(shù);MA 為“滑動(dòng)平均”,q 為滑動(dòng)平均項(xiàng)數(shù),d 為使之成為平穩(wěn)序列所做的差分階數(shù)。對(duì)于每一個(gè)時(shí)間序列,都需要確定最適合的超參數(shù) p,d,q,通常有一套成熟的策略進(jìn)行人工選擇,如通過觀察差分之后的平穩(wěn)性確定 d,通過觀察 ACF 曲線和 PACF 曲線確定 q 和 p 等等。但是,對(duì)于數(shù)以萬計(jì)的時(shí)間序列來說,人工調(diào)整顯然不可行,這套經(jīng)驗(yàn)策略也較難量化,因此我們采用類似網(wǎng)格搜索的方法確定超參數(shù),這一過程也被稱為自動(dòng)定階。

周期性檢測(cè)

ARIMA 模型沒有考慮時(shí)間序列的季節(jié)性(也稱作周期性,下文統(tǒng)稱周期性)變化,但周期性是大多數(shù)跟流量相關(guān)的指標(biāo)必須要考慮的一個(gè)因素,并且不同的業(yè)務(wù)模式的流量周期是不一樣的,看下面的兩個(gè)例子。

67607648-567f-11ed-a3b6-dac502259ad0.png

如上圖所示,按小時(shí)粒度聚合的 2 個(gè)指標(biāo),其周期分別為 24 和 168,分別代表每天重復(fù)的模式和每周重復(fù)的模式。

我們需要給出最匹配這個(gè)時(shí)間序列的周期值,即周期性檢測(cè)。周期性檢測(cè)的方法有很多,第一種就是相似度檢測(cè),假設(shè)周期為 T,將時(shí)間序列按照長(zhǎng)度為 T 進(jìn)行切分得到若干個(gè)分段,計(jì)算相鄰分段的相似度。第二種方法是分析 ACF 曲線,ACF 全稱是 Autocorrelation function,其表達(dá)了時(shí)間序列和自身偏移一定量之后的相關(guān)性。通過觀察 ACF 曲線的特點(diǎn)可以推斷出時(shí)間序列周期。除了這兩種方法外,周期性檢測(cè)還有快速傅里葉變換(FFT)、小波變換等方法。我們根據(jù)不同指標(biāo)的時(shí)間粒度、數(shù)據(jù)量和不同方法的計(jì)算復(fù)雜度、準(zhǔn)確性等,根據(jù)經(jīng)驗(yàn)和實(shí)驗(yàn)結(jié)果構(gòu)建了一個(gè)的選擇周期性檢測(cè)方法的決策樹,由最適合的一種或幾種方法,綜合計(jì)算出時(shí)間序列的周期。

Seasonal ARIMA

由于普通的 ARIMA 模型不能夠處理周期性,Seasonal ARIMA 模型引入了季節(jié)分量,可以更好地處理周期性,通常寫作 SARIMA(p,d,q)(P,D,Q,s) 。s 是時(shí)間序列的周期,P,D,Q 分別對(duì)應(yīng)季節(jié)分量的滑動(dòng)平均項(xiàng)數(shù)、差分階數(shù)和滑動(dòng)平均項(xiàng)數(shù)。

在訓(xùn)練數(shù)據(jù)的選取上,雖然歷史數(shù)據(jù)越多,模型擬合地會(huì)更好,但并不是越多越好,一方面,數(shù)據(jù)量增加會(huì)使得 ARIMA 模型擬合時(shí)間變長(zhǎng),另一方面,業(yè)務(wù)指標(biāo)的模式可能隨著時(shí)間而發(fā)生變化。以小時(shí)粒度指標(biāo),對(duì)于無周期的 ARIMA 模型,200~300 多個(gè)點(diǎn)即可取得比較好的效果,也就是 7~14 天左右的歷史數(shù)據(jù);對(duì)于周期性的 SARIMA 模型,5~10 個(gè)周期即可取得比較好的效果,對(duì)于呈現(xiàn)每周重復(fù)的模式,6 周左右的數(shù)據(jù)可以取得比較好的效果。

如何計(jì)算上下界

有了預(yù)測(cè)值之后,接下來我們需要得到判斷異常的上下界閾值,ARIMA 模型在輸出預(yù)測(cè)結(jié)果的同時(shí),也輸出了置信區(qū)間。置信區(qū)間概率論里的一個(gè)概念,是基于區(qū)間估計(jì)的結(jié)果,在預(yù)測(cè)的場(chǎng)景下,代表預(yù)測(cè)結(jié)果會(huì)一定的概率出現(xiàn)在這個(gè)區(qū)間,這個(gè)概率就被稱為置信度。當(dāng)隨機(jī)變量符合正態(tài)分布時(shí),95% 置信度的置信區(qū)間近似等于均值加減 2 倍標(biāo)準(zhǔn)差,而均值加減 3 倍標(biāo)準(zhǔn)差的置信度為 99.7%,這也就是常說的 2 倍標(biāo)準(zhǔn)差法和 3 倍標(biāo)準(zhǔn)差法。將置信區(qū)間作為判斷異常的上下界閾值時(shí)最適合不過的了,當(dāng)置信度越大時(shí),置信區(qū)間越寬,超出上下界閾值的異常就越顯著,換句話說,業(yè)務(wù)指標(biāo)的異常就越嚴(yán)重。通過設(shè)置不同的置信度,我們可以探測(cè)到不同嚴(yán)重程度的異常。

在實(shí)際應(yīng)用時(shí),由于我們的業(yè)務(wù)指標(biāo)通常時(shí)非負(fù)的,并不能滿足正態(tài)分布(或者高斯分布),因此 ARIMA 模型直接輸出的置信區(qū)間就不合適了。通過分析發(fā)現(xiàn),絕大多數(shù)業(yè)務(wù)指標(biāo)近似滿足從零處截?cái)嗟慕財(cái)嗾龖B(tài)分布(高斯分布),因此我們只需要取出 ARIMA 模型輸出的預(yù)測(cè)值和標(biāo)準(zhǔn)誤差,就可以利用截?cái)嗾龖B(tài)分布的累計(jì)分布函數(shù)和分位函數(shù)計(jì)算出置信區(qū)間。

V1.0 系統(tǒng)架構(gòu)

有了第一版的模型的結(jié)果,我們上線了異常檢測(cè)系統(tǒng) V1.0,架構(gòu)如下圖所示:

676f3c00-567f-11ed-a3b6-dac502259ad0.png

V1.0 系統(tǒng)的核心就是指標(biāo)預(yù)測(cè)服務(wù),指標(biāo)預(yù)測(cè)服務(wù)將需要預(yù)測(cè)的指標(biāo)的預(yù)測(cè)結(jié)果和報(bào)警上下界輸出到監(jiān)控平臺(tái),通過在監(jiān)控平臺(tái)上對(duì)需要進(jìn)行異常檢測(cè)到指標(biāo)配置報(bào)警規(guī)則,由監(jiān)控平臺(tái)實(shí)時(shí)檢查是否滿足報(bào)警要求,也就是超過上下界,從而觸發(fā)報(bào)警。指標(biāo)預(yù)測(cè)服務(wù)是基于 PySpark 實(shí)現(xiàn)的,由兩類定時(shí)任務(wù)構(gòu)成。第一類是周期性檢測(cè)和模型訓(xùn)練,頻率較低,大約每天執(zhí)行一次,負(fù)責(zé)將所有需要檢測(cè)的指標(biāo)和維度下的時(shí)間序列都進(jìn)行周期性檢測(cè)、ARIMA 超參數(shù)選取和 ARIMA 模型訓(xùn)練,并將周期數(shù)、ARIMA 超參數(shù)和 ARIMA 模型參數(shù)進(jìn)行保存。

第二類是預(yù)測(cè)任務(wù),基于 Spark 的并行計(jì)算能力,可以實(shí)現(xiàn)在較短時(shí)間能完成大量時(shí)間序列的預(yù)測(cè)工作。以小時(shí)級(jí)任務(wù)為例,每次預(yù)測(cè)任務(wù)都會(huì)預(yù)測(cè)時(shí)間序列未來 N 個(gè)小時(shí)(例如 N=24)的指標(biāo)值和上下界,并寫入數(shù)據(jù)庫(kù);小時(shí)級(jí)任務(wù)可以配置每隔 M 個(gè)小時(shí)(例如 M=6)執(zhí)行一次,同時(shí)覆蓋之前的預(yù)測(cè)結(jié)果。這樣做的好處是既保證了預(yù)測(cè)數(shù)據(jù)的冗余,使得在預(yù)測(cè)任務(wù)失敗或者延誤的時(shí)候還有之前的預(yù)測(cè)結(jié)果可以使用,同時(shí)執(zhí)行預(yù)測(cè)任務(wù)的 executor 可以允許在按需申請(qǐng)的 spot instance ec2 上,節(jié)約了計(jì)算成本,由于 spot instance 的不可靠性,預(yù)測(cè)任務(wù)可能隨時(shí)失敗,只要重試即可。另一方面,配置 M

當(dāng)前的問題和優(yōu)化

對(duì)第一版的結(jié)果進(jìn)行分析,我們發(fā)現(xiàn)有下面幾個(gè)問題會(huì)導(dǎo)致精確率(Precision)不足,誤報(bào)較多:

1) 區(qū)間太緊

首先是置信區(qū)間的問題,當(dāng)我們選好一個(gè)合適的置信度,如 99%,會(huì)發(fā)現(xiàn)對(duì)于多數(shù)時(shí)間序列都是合適的,但對(duì)于那些規(guī)律性比較強(qiáng)的時(shí)間序列來說,其模型的擬合度非常好,MAPE 能小于 5%,預(yù)測(cè)的標(biāo)準(zhǔn)誤差很低,因此置信區(qū)間會(huì)比較窄,如圖:

67bb3a9c-567f-11ed-a3b6-dac502259ad0.png

這就會(huì)導(dǎo)致如果指標(biāo)出現(xiàn)輕微的抖動(dòng),比如 +/-10%,就會(huì)被識(shí)別為異常,這顯然是我們不希望看到的。我們的改進(jìn)有兩點(diǎn),第一是對(duì)標(biāo)準(zhǔn)誤差進(jìn)行放大,當(dāng)標(biāo)準(zhǔn)誤差 / 均值的比例小于一定的程度時(shí),將標(biāo)準(zhǔn)誤差乘以一定的放大系數(shù),再計(jì)算置信區(qū)間;第二是利用預(yù)期的抖動(dòng)比例進(jìn)行干預(yù),將計(jì)算出來的置信區(qū)間和基于經(jīng)驗(yàn)配置的容忍抖動(dòng)比例(如 +/-20%)進(jìn)行融合,這樣得出的上下界既能符合模型的擬合結(jié)果,也能在業(yè)務(wù)上看來不至于特別離譜。

67cb017a-567f-11ed-a3b6-dac502259ad0.png

2) 數(shù)據(jù)包含噪音

第二點(diǎn),歷史數(shù)據(jù)中包含異常點(diǎn),會(huì)對(duì)模型的擬合和預(yù)測(cè)產(chǎn)生一定的影響。例如如果前一天流量因?yàn)槟承┰颍ㄈ鐗毫y(cè)試)有一個(gè)很明顯的尖峰,那大概率 ARIMA 模型預(yù)測(cè)的今天同周期也會(huì)相應(yīng)地變高,從而導(dǎo)致對(duì)正常流量的誤判。我們從兩個(gè)方面解決這個(gè)問題,第一是模型啟動(dòng)的時(shí)候,我們用一個(gè)規(guī)則去識(shí)別那些比較明顯的異常點(diǎn);然后,當(dāng)我們的模型開始運(yùn)行,異常點(diǎn)被檢測(cè)出來后,我們通過建立反饋機(jī)制修正模型的輸入數(shù)據(jù),將異常點(diǎn)的值修正為此前的預(yù)測(cè)值,后面模型的預(yù)測(cè)將不會(huì)收異常點(diǎn)的影響。當(dāng)然如果異常點(diǎn)識(shí)別錯(cuò)了,反饋機(jī)制會(huì)帶來負(fù)面效應(yīng),處理這個(gè)異常報(bào)警的運(yùn)營(yíng)人員會(huì)對(duì)其進(jìn)行標(biāo)記,從而避免這個(gè)問題。

3) 數(shù)據(jù)太稀疏

此外,我們發(fā)現(xiàn),有一大部分時(shí)間序列的數(shù)據(jù)非常稀疏,也就是其歷史上的取值經(jīng)常缺失,導(dǎo)致時(shí)序預(yù)測(cè)準(zhǔn)確度較差。針對(duì)這種情況,從業(yè)務(wù)的角度考慮,我們通過設(shè)置閾值跳過數(shù)據(jù)太稀疏或者歷史流量過少的的場(chǎng)景,減少誤報(bào)。

第二代系統(tǒng) (V2.0) V1.0 的不足

V1.0 異常檢測(cè)系統(tǒng)有幾個(gè)問題,首先在系統(tǒng)層面,隨著需要配置異常檢測(cè)報(bào)警的指標(biāo)越來越多,通過 Hard Code 的方式部署的指標(biāo)預(yù)測(cè)服務(wù)的擴(kuò)展性問題就凸顯出來;另外,業(yè)務(wù)上希望對(duì)于指標(biāo)短時(shí)間抖動(dòng)或者業(yè)務(wù)影響比較小的異常進(jìn)行過濾,現(xiàn)有的架構(gòu)難以實(shí)現(xiàn)。在模型層面,ARIMA(SARIMA)模型在很多場(chǎng)景下預(yù)測(cè)誤差較大,基于這樣的預(yù)測(cè)結(jié)果計(jì)算的上下界會(huì)導(dǎo)致較多誤報(bào)警。

針對(duì) V1.0 系統(tǒng)和模型的不足,我們?cè)O(shè)計(jì)了第二代異常檢測(cè)系統(tǒng) V2.0。

異常檢測(cè)系統(tǒng) V2.0 架構(gòu)

在第二版的異常檢測(cè)系統(tǒng)中,我們將異常檢測(cè)的工作從監(jiān)控平臺(tái)完全剝離出來,專注于優(yōu)化異常檢測(cè)算法和策略,進(jìn)而提升異常檢測(cè)的效果。異常檢測(cè)系統(tǒng)將結(jié)果以異常得分的形式輸出給監(jiān)控平臺(tái),由監(jiān)控平臺(tái)負(fù)責(zé)報(bào)警和運(yùn)營(yíng)操作。下面是系統(tǒng)整體的架構(gòu)圖。

680e998a-567f-11ed-a3b6-dac502259ad0.png

異常檢測(cè)系統(tǒng)包括元數(shù)據(jù)管理、模型訓(xùn)練、異常評(píng)估等幾個(gè)模塊。元數(shù)據(jù)理負(fù)責(zé)和監(jiān)控平臺(tái)同步異常檢測(cè)需求和配置信息,如要檢測(cè)的指標(biāo)、數(shù)據(jù)源、維度、過濾條件等,并生成對(duì)應(yīng)的時(shí)間序列元數(shù)據(jù)。模型訓(xùn)練和之前相似,不同的是從批任務(wù)變成了實(shí)時(shí)任務(wù),通過內(nèi)置的調(diào)度模塊,一方面要服務(wù)監(jiān)控平臺(tái)實(shí)時(shí)配置的需求,對(duì)于新增的時(shí)間序列要優(yōu)先進(jìn)行訓(xùn)練,另一方面也要定期地對(duì)舊模型進(jìn)行更新。

異常評(píng)估模塊

異常評(píng)估模塊也是一個(gè)長(zhǎng)期運(yùn)行的 Spark 應(yīng)用,內(nèi)置的調(diào)度模塊會(huì)調(diào)度每個(gè)任務(wù)的運(yùn)行,同時(shí)考慮實(shí)時(shí)數(shù)據(jù)源依賴、數(shù)據(jù)完整性檢查、指標(biāo)歷史數(shù)據(jù)緩存、任務(wù)優(yōu)先級(jí)等,將適合的任務(wù)提交 Spark Job Group。每個(gè) Spark Job Group 都包括指標(biāo)數(shù)據(jù)查詢、數(shù)據(jù)處理、并行的時(shí)間序列異常檢測(cè)和結(jié)果匯總與輸出等多個(gè) Spark Job/Stage,其中最核心的是并行的時(shí)間序列異常檢測(cè)的 Stage,多個(gè) Task 由 Spark 調(diào)度并行執(zhí)行。

異常評(píng)估模塊的另外一個(gè)關(guān)鍵點(diǎn)是對(duì)異常進(jìn)行評(píng)估和打分 (0 到 1 之間的分?jǐn)?shù)),異常比較明顯或者對(duì)業(yè)務(wù)影響比較大的異常的得分更接近 1,不明顯的異常、噪音、對(duì)業(yè)務(wù)影響小的異常的得分更接近 0。相比 V1.0 異常檢測(cè)系統(tǒng),引入異常評(píng)估模塊后極大地提升了異常檢測(cè)的能力,一方面可以引入基于規(guī)則和策略的評(píng)估,另一方面可以直接基于無監(jiān)督或者監(jiān)督的機(jī)器學(xué)習(xí)模型給出異常打分。由于基于規(guī)則和策略的評(píng)估方法可解釋性更強(qiáng),占線上多數(shù)場(chǎng)景都采用此方法;在一些特殊業(yè)務(wù)場(chǎng)景中,通過模型直接打分也取得了不錯(cuò)的效果。

下面簡(jiǎn)單介紹下我們的打分策略,首先,選取評(píng)估窗口,即同時(shí)評(píng)估最近的幾個(gè)時(shí)刻指標(biāo)值的異常情況,評(píng)估窗口數(shù)據(jù)的異常相比只評(píng)估點(diǎn)數(shù)據(jù)的異常可以減少噪音的影響,當(dāng)然,越新的數(shù)據(jù)權(quán)重越大。以流量指標(biāo)為例,我們綜合了以下幾個(gè)因素進(jìn)行評(píng)估:是否超出上下界、相比預(yù)測(cè)值流量異常下降(或者上漲)的幅度,即重構(gòu)誤差、歷史流量大小,當(dāng)前所處時(shí)刻流量的相對(duì)大小、異常持續(xù)的時(shí)間、歷史上發(fā)生過類似異常的頻率等。

除了基于影響的評(píng)估之外,我們還構(gòu)建了根因分析系統(tǒng)對(duì)異常進(jìn)行歸因分析,提供一站式業(yè)務(wù)運(yùn)營(yíng)解決方案,極大地提高了運(yùn)營(yíng)效率,同時(shí)消除由于業(yè)務(wù)上預(yù)期的“指標(biāo)異?!睂?dǎo)致的誤報(bào)警。對(duì)于可以簡(jiǎn)單找到根因的異常,我們選擇直接在異常檢測(cè)階段進(jìn)行消除,而不是導(dǎo)入根因分析系統(tǒng),來減少計(jì)算壓力。例如,程序化交易的流量異常下降,很可能是交易暫停,或者已經(jīng)達(dá)到預(yù)算等原因?qū)е碌摹?/p>

新的算法模型 預(yù)測(cè)模型

ARIMA(SARIMA)模型能夠較好地?cái)M合大多數(shù)的時(shí)間序列,但在實(shí)際使用中有兩個(gè)比較突出的問題:一、對(duì)于不帶周期項(xiàng)的 ARIMA,其預(yù)測(cè)結(jié)果會(huì)有較為明顯的滯后現(xiàn)象,容易導(dǎo)致誤判;二、如果周期數(shù)過大,模型擬合的速度很慢,如對(duì)于小時(shí)粒度的數(shù)據(jù),當(dāng)周期為 168 時(shí),其單線程擬合時(shí)間超過 5 分鐘。為了彌補(bǔ) ARIMA 模型的不足,我們引入了 XGBoost、STL、SMA 和 EVT 等模型,不同的模型有各自的優(yōu)缺點(diǎn)和適合的應(yīng)用場(chǎng)景,下面我們先簡(jiǎn)單介紹下這些模型。

XGBoost

XGBoost 是一個(gè)梯度提升決策樹(GBDT)的高效實(shí)現(xiàn),以極強(qiáng)的模型學(xué)習(xí)效果和性能著稱,可以解決 SARIMA 長(zhǎng)周期預(yù)測(cè)性能無法滿足要求的問題。應(yīng)用到時(shí)間序列預(yù)測(cè)時(shí),需要人工進(jìn)行特征工程,我們選取了這么幾類特征:

第一類是時(shí)間序列的 lag(滯后算子),也就是要預(yù)測(cè)的時(shí)刻 T 的前面時(shí)刻的值,如 T-1,T-2…. lag 并不是越多越好,對(duì)于小時(shí)粒度的數(shù)據(jù),如果輸入是 5 周(840),那么約靠前的 lag 可能的價(jià)值就越低,我們根據(jù)周期的不同,選取的 lag 數(shù)也不一樣。如前序判斷為 24 周期,則選取 1~40 lag,和每 24 個(gè)周期選取同周期的 lag,如 t-48,t-96,等等。

第二類是時(shí)間特征,如星期幾、是否為周末、當(dāng)前小時(shí)等。

第三類是時(shí)間窗口統(tǒng)計(jì)特征,如最近 24 小時(shí)的平均值,工作日的平均值,周末的平均值,過去 7 天當(dāng)前小時(shí)的平均值,等等。

XGBoost 的擬合能力是非常強(qiáng)的,因此擺在我們面前很大的問題是如何避免過擬合,也就是雖然在訓(xùn)練數(shù)據(jù)上模型擬合地非常好,但在驗(yàn)證數(shù)據(jù)上預(yù)測(cè)誤差較大。首先是從參數(shù)入手,包括使用 L2 正則,限制樹的深度、對(duì)訓(xùn)練數(shù)據(jù)進(jìn)行采樣,預(yù)剪枝等參數(shù)都會(huì)起到一定的效果。此外,如果訓(xùn)練數(shù)據(jù)不足,過擬合是很難避免的,因此 XGBoost 只適用于時(shí)間序列歷史數(shù)據(jù)非常多的情況。

此外,另一種解決單一的時(shí)間序列訓(xùn)練數(shù)據(jù)量較少的方法,是通過對(duì)相同指標(biāo)不同維度的時(shí)間序列進(jìn)行聚類,將相似的維度值對(duì)應(yīng)的時(shí)間序列放到一起訓(xùn)練模型,這樣可以增加訓(xùn)練數(shù)據(jù)量,緩解過擬合的問題。但這種方法擴(kuò)展性較差,需要根據(jù)具體的指標(biāo)和維度對(duì)應(yīng)的時(shí)間序列的情況單獨(dú)調(diào)整。

STL

對(duì)于某些長(zhǎng)周期的指標(biāo),我們面臨 SARIMA 擬合時(shí)間非常長(zhǎng),又沒有足夠的數(shù)據(jù)訓(xùn)練 XGboost 的情況,這時(shí)候時(shí)間序列分解派上用場(chǎng)了。時(shí)間序列分解是將時(shí)間序列分解為均值 (Mean) 、趨勢(shì) (Trend) 、季節(jié) (Seasonality) 、循環(huán) (Cycle)、隨機(jī)誤差 (Random) 這幾個(gè)部分,分解方式通常包括乘法和加法。趨勢(shì)表示這個(gè)時(shí)間序列的長(zhǎng)期趨勢(shì),通常加上了均值,季節(jié)性(也叫周期性)指時(shí)間序列隨著時(shí)間的季節(jié)波動(dòng),通常是年、周、日等,循環(huán)指的是指標(biāo)在較長(zhǎng)時(shí)間呈現(xiàn)出上下波動(dòng),通常會(huì)被合并到趨勢(shì)項(xiàng)中,稱作趨勢(shì) - 循環(huán)項(xiàng)(trend-cycle)。

將時(shí)間序列的周期和趨勢(shì)分解開之后,我們可以通過更加簡(jiǎn)單的模型,如 ARMA,去擬合趨勢(shì),對(duì)于周期項(xiàng),只需要簡(jiǎn)單的重復(fù)即可,最后將趨勢(shì)的預(yù)測(cè)結(jié)果和周期相加即刻得到最終的預(yù)測(cè)結(jié)果。

6819c602-567f-11ed-a3b6-dac502259ad0.png

圖片來源于https://otexts.com/fpp2/stl.html

經(jīng)典的乘法和加法分解只能支持固定周期,且受歷史數(shù)據(jù)的異常點(diǎn)影響較大,STL(Seasonal and Trend decomposition using Loess) 分解則較好地解決了這兩種問題,我們選用 STL 分解結(jié)合 ARIMA 擬合趨勢(shì)的方法,較好地解決了長(zhǎng)周期時(shí)間序列的預(yù)測(cè)問題。除了 STL 之外,還有 X11 和 SEATS 等分解方法。

SMA

在線上實(shí)際運(yùn)行時(shí),我們發(fā)現(xiàn)無論是 ARIMA、XGboost,還是 STL 分解,其模型訓(xùn)練時(shí)間都在分鐘級(jí),預(yù)測(cè)時(shí)間都在秒級(jí),對(duì)于那些時(shí)間序列數(shù)量巨大的業(yè)務(wù)指標(biāo)來說,顯然是非常不經(jīng)濟(jì)的。

同時(shí)我們發(fā)現(xiàn),這些業(yè)務(wù)指標(biāo)都有一個(gè)特點(diǎn),對(duì)于多數(shù)時(shí)間序列,他們的模式是非常穩(wěn)定的,因此設(shè)計(jì)一種快速地算法解決這類問題可以極大地降低異常檢測(cè)的成本。

我們從常用的同環(huán)比出發(fā),設(shè)計(jì)一種結(jié)合周期的帶權(quán)移動(dòng)平均方法(Seasonality Moving Average,簡(jiǎn)稱 SMA),可以在毫秒級(jí)完成預(yù)測(cè)任務(wù)。預(yù)測(cè)值為同比(最近幾個(gè)周期同時(shí)刻)和環(huán)比(最近的數(shù)據(jù))的加權(quán)平均,以小時(shí)粒度指標(biāo),周期為 24 時(shí)為例:

6850f0e6-567f-11ed-a3b6-dac502259ad0.png

r(recent): 考慮最近的數(shù)據(jù)點(diǎn)數(shù)

α(alpha): 最近數(shù)據(jù)的權(quán)重

c(cycles): 考慮的周期數(shù)

o(offsets): 同周期前后偏離的點(diǎn)數(shù)

預(yù)測(cè)模型的評(píng)估

對(duì)于以上的時(shí)間序列預(yù)測(cè)模型,需要評(píng)估其預(yù)測(cè)的準(zhǔn)確程度,我們選用 SMAPE 作為預(yù)測(cè)模型準(zhǔn)確性的評(píng)估指標(biāo):

685bdd76-567f-11ed-a3b6-dac502259ad0.png

SMAPE 反映了模型擬合歷史數(shù)據(jù)的誤差,在模型擬合能力一定時(shí),也反應(yīng)了該時(shí)間序列的可預(yù)測(cè)性,或者叫模式(pattern)的強(qiáng)弱。上面四種模型基本上可以滿足多數(shù)時(shí)間序列的異常檢測(cè),但是對(duì)于周期性和模式都比較弱的時(shí)間序列來說,上述模型預(yù)測(cè)誤差都比較大,通常 SMAPE>70,會(huì)導(dǎo)致有較多的異常誤報(bào)。最初的做法是忽略這類時(shí)間序列的異常檢測(cè),在一定程度上解決了異常檢測(cè)精準(zhǔn)率不足的問題,但也降低了召回率。

EVT

為了提升周期性和模式都比較弱的時(shí)間序列異常檢測(cè)的召回率,我們引入了極值理論(Extreme Value Theory,簡(jiǎn)稱 EVT)。極值理論可以在數(shù)據(jù)分布位置的條件下,估計(jì)極值(極大值和極小值)的分布,從而估計(jì)正常數(shù)據(jù)合理的上下界。由于篇幅原因,本文不詳細(xì)描述具體算法實(shí)現(xiàn),大家感興趣可以閱讀論文(https://www.researchgate.net/publication/318919520)。論文作者考慮了概念漂移的問題,但沒有考慮數(shù)據(jù)的周期性。對(duì)于存在一定周期性的時(shí)間序列,我們?cè)趹?yīng)用極值理論模型的時(shí)候會(huì)先根據(jù)周期性進(jìn)行數(shù)據(jù)采樣,對(duì)于同周期的數(shù)據(jù),采樣的概率更大,這樣更符合實(shí)際情況,對(duì)異常檢測(cè)的準(zhǔn)確率也更高。

模型對(duì)比

目前我們引入的模型有 ARIMA、XGBoost、STL-ARIMA、SMA、EVT 等,我們先來總結(jié)一下這些模型的特點(diǎn):

686d0a56-567f-11ed-a3b6-dac502259ad0.png

模型選擇

隨著模型引入越來越多,我們需要一套方法為特定的時(shí)間序列選擇合適的模型。根據(jù)這些模型的特點(diǎn),我們建立了一個(gè)決策樹,根據(jù)指標(biāo)的類型、周期性、歷史數(shù)據(jù)量、實(shí)時(shí)性、成本等因素,選擇合適的候選模型方案。

一個(gè)候選模型方案包括首選模型、若干個(gè)備選模型和保底模型。舉一個(gè)典型的例子,因?yàn)闃O低的成本,SMA 將被作為首選模型,首先用 SMA 擬合時(shí)間序列的歷史數(shù)據(jù),并給予設(shè)定好的驗(yàn)證數(shù)據(jù)窗口,如最近 3 天,計(jì)算預(yù)測(cè)的 SMAPE 誤差,若 SMAPE 小于預(yù)設(shè)的閾值(如 50),則認(rèn)為 SMA 的擬合是有效的并將其作為模型選擇的結(jié)果,否則,將嘗試備選模型。假設(shè) ARIMA、XGBoost、STL-ARIMA 都可以做為備選模型,則分別嘗試對(duì)這三種模型進(jìn)行擬合,在 SMAPE 小于閾值的模型中選擇最優(yōu)的作為模型選擇的結(jié)果。如果備選模型都不能滿足需求,則判斷有沒有保底模型,如果有保底模型(比如 EVT),則將其作為模型選擇的結(jié)果,否則這個(gè)時(shí)間序列被認(rèn)為是無效的。

總結(jié) & 未來展望

FreeWheel 業(yè)務(wù)異常檢測(cè)系統(tǒng)從上線至今已有兩年的時(shí)間,共接入了十幾種業(yè)務(wù)場(chǎng)景和幾十種指標(biāo),如針對(duì)不同客戶集成方式的流量監(jiān)控、程序化交易全生命周期的異常檢測(cè)及根因分析等,幫助 FreeWheel 和客戶主動(dòng)發(fā)現(xiàn)廣告投放中的若干個(gè) P1、P2 級(jí)別的嚴(yán)重問題,減少了客戶的損失,在維護(hù)客戶關(guān)系方面發(fā)揮了重大作用。下一步,我們會(huì)支持更多的業(yè)務(wù),尤其是針對(duì) FreeWheel Marketplace 的業(yè)務(wù),發(fā)現(xiàn)和解決廣告需求側(cè)和供給側(cè)之間的匹配問題,以及客戶流量的廣告填充率不足的根因分析,幫助客戶提高廣告投放效果和利潤(rùn)。

從算法和模型的角度,目前線上大多數(shù)模型都是基于時(shí)間序列預(yù)測(cè)、針對(duì)特定指標(biāo)和維度(時(shí)間序列)自動(dòng)訓(xùn)練的小模型,其優(yōu)點(diǎn)是靈活性和擴(kuò)展性好,成本低;缺點(diǎn)也比較明顯,不方便針對(duì)具體的業(yè)務(wù)優(yōu)化特征工程,包括多指標(biāo)協(xié)同、不同維度和標(biāo)簽之間的數(shù)據(jù)依賴等。因此,我們針對(duì)幾種特殊的業(yè)務(wù)場(chǎng)景,如程序化交易,開發(fā)了基于神經(jīng)網(wǎng)絡(luò)的大模型;除此之外,我們也對(duì)其他的無監(jiān)督、監(jiān)督和半監(jiān)督方法進(jìn)行了研究和開發(fā),希望后面能分享給大家。

作者簡(jiǎn)介

鐘雨,本科和研究生就讀于清華大學(xué),現(xiàn)任 FreeWheel 異常檢測(cè)團(tuán)隊(duì)主任算法工程師,F(xiàn)reeWheel 業(yè)務(wù)異常檢測(cè)算法團(tuán)隊(duì)負(fù)責(zé)人。曾供職于京東廣告數(shù)據(jù)團(tuán)隊(duì),Spark Contributor,具備豐富的大數(shù)據(jù)開發(fā)與調(diào)優(yōu)、數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)經(jīng)驗(yàn),在廣告大數(shù)據(jù)行業(yè)深耕多年。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴

原文標(biāo)題:從零開始構(gòu)建業(yè)務(wù)異常檢測(cè)系統(tǒng),F(xiàn)reeWheel面臨過的問題和解決方案

文章出處:【微信號(hào):AI前線,微信公眾號(hào):AI前線】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    基于機(jī)器學(xué)習(xí)的IWR6843AOP跌倒和姿態(tài)檢測(cè)實(shí)現(xiàn)

    電子發(fā)燒友網(wǎng)站提供《基于機(jī)器學(xué)習(xí)的IWR6843AOP跌倒和姿態(tài)檢測(cè)實(shí)現(xiàn).pdf》資料免費(fèi)下載
    發(fā)表于 09-03 10:02 ?0次下載
    基于<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>的IWR6843AOP跌倒和姿態(tài)<b class='flag-5'>檢測(cè)</b>實(shí)現(xiàn)

    【「時(shí)間序列與機(jī)器學(xué)習(xí)」閱讀體驗(yàn)】+ 鳥瞰這本書

    清晰,從時(shí)間序列分析的基礎(chǔ)理論出發(fā),逐步深入到機(jī)器學(xué)習(xí)算法在時(shí)間序列預(yù)測(cè)中的應(yīng)用,內(nèi)容全面,循序漸進(jìn)。每一章都經(jīng)過精心設(shè)計(jì),對(duì)理論知識(shí)進(jìn)行了詳細(xì)的闡述,對(duì)實(shí)際案例進(jìn)行了生動(dòng)的展示,使讀者在理論與實(shí)踐
    發(fā)表于 08-12 11:28

    【「時(shí)間序列與機(jī)器學(xué)習(xí)」閱讀體驗(yàn)】+ 簡(jiǎn)單建議

    這本書以其系統(tǒng)性的框架和深入淺出的講解,為讀者繪制了一幅時(shí)間序列分析與機(jī)器學(xué)習(xí)融合應(yīng)用的宏偉藍(lán)圖。作者不僅扎實(shí)地構(gòu)建了時(shí)間序列分析的基礎(chǔ)知識(shí),更巧妙地展示了機(jī)器學(xué)習(xí)如何在這一領(lǐng)域發(fā)揮巨
    發(fā)表于 08-12 11:21

    【《時(shí)間序列與機(jī)器學(xué)習(xí)》閱讀體驗(yàn)】+ 了解時(shí)間序列

    收到《時(shí)間序列與機(jī)器學(xué)習(xí)》一書,彩色印刷,公式代碼清晰,非常精美。感謝作者,感謝電子發(fā)燒友提供了一個(gè)讓我學(xué)習(xí)時(shí)間序列及應(yīng)用的機(jī)會(huì)! 前言第一段描述了編寫背景: 由此可知,這是一本關(guān)于時(shí)間序列進(jìn)行大數(shù)
    發(fā)表于 08-11 17:55

    【「時(shí)間序列與機(jī)器學(xué)習(xí)」閱讀體驗(yàn)】全書概覽與時(shí)間序列概述

    如何通過根因分析技術(shù)獲得導(dǎo)致故障的維度和元素,包括基于時(shí)間序列異常檢測(cè)算法的根因分析、基于熵的根因分析、基于樹模型的根因分析、規(guī)則學(xué)習(xí)等。 ●第7章“智能運(yùn)維的應(yīng)用場(chǎng)景”:介紹智能運(yùn)維領(lǐng)域的應(yīng)用,包括
    發(fā)表于 08-07 23:03

    深度學(xué)習(xí)在工業(yè)機(jī)器視覺檢測(cè)中的應(yīng)用

    隨著深度學(xué)習(xí)技術(shù)的快速發(fā)展,其在工業(yè)機(jī)器視覺檢測(cè)中的應(yīng)用日益廣泛,并展現(xiàn)出巨大的潛力。工業(yè)機(jī)器視覺檢測(cè)是工業(yè)自動(dòng)化領(lǐng)域的重要組成部分,通過圖
    的頭像 發(fā)表于 07-08 10:40 ?586次閱讀

    名單公布!【書籍評(píng)測(cè)活動(dòng)NO.35】如何用「時(shí)間序列與機(jī)器學(xué)習(xí)」解鎖未來?

    應(yīng)用,將理論基礎(chǔ)與實(shí)踐案例相結(jié)合,作者憑借扎實(shí)的數(shù)學(xué)功底及其在企業(yè)界的豐富實(shí)踐經(jīng)驗(yàn),將機(jī)器學(xué)習(xí)與時(shí)間序列分析巧妙融合在書中。 全書書共分為8章,系統(tǒng)介紹時(shí)間序列的基礎(chǔ)知識(shí)、常用預(yù)測(cè)方法
    發(fā)表于 06-25 15:00

    工業(yè)異常檢測(cè)超越特定閾值限制的解決方案

    異常檢測(cè)和分割(AD&S)對(duì)于工業(yè)質(zhì)量控制至關(guān)重要。雖然現(xiàn)有方法在為每個(gè)像素生成異常分?jǐn)?shù)方面表現(xiàn)出色,但實(shí)際應(yīng)用需要產(chǎn)生一個(gè)二進(jìn)制分割來識(shí)別異常。
    發(fā)表于 04-09 10:44 ?382次閱讀
    工業(yè)<b class='flag-5'>異常</b><b class='flag-5'>檢測(cè)</b>超越特定閾值限制的解決方案

    機(jī)器視覺如何檢測(cè)橡膠圈外觀尺寸檢測(cè)

    表面是否存在異物,如雜質(zhì)或污漬。系統(tǒng)能夠快速識(shí)別并標(biāo)記出這些異物?;?b class='flag-5'>機(jī)器學(xué)習(xí)算法,機(jī)器視覺系統(tǒng)可以將檢測(cè)到的橡膠圈按照不同的標(biāo)準(zhǔn)進(jìn)行分類,提高產(chǎn)品
    的頭像 發(fā)表于 03-15 17:24 ?422次閱讀

    基于機(jī)器視覺和深度學(xué)習(xí)的焊接質(zhì)量檢測(cè)系統(tǒng)

    基于機(jī)器視覺和深度學(xué)習(xí)的焊接質(zhì)量檢測(cè)系統(tǒng)是一種創(chuàng)新性的技術(shù)解決方案,它結(jié)合了先進(jìn)的計(jì)算機(jī)視覺和深度學(xué)習(xí)算法,用于實(shí)時(shí)監(jiān)測(cè)和評(píng)估焊接過程中的焊縫質(zhì)量。這一系統(tǒng)在工業(yè)制造中發(fā)揮著重要作用,
    的頭像 發(fā)表于 01-18 17:50 ?605次閱讀

    基于DiAD擴(kuò)散模型的多類異常檢測(cè)工作

    現(xiàn)有的基于計(jì)算機(jī)視覺的工業(yè)異常檢測(cè)技術(shù)包括基于特征的、基于重構(gòu)的和基于合成的技術(shù)。最近,擴(kuò)散模型因其強(qiáng)大的生成能力而聞名,因此本文作者希望通過擴(kuò)散模型將異常區(qū)域重構(gòu)成正常。
    的頭像 發(fā)表于 01-08 14:55 ?914次閱讀
    基于DiAD擴(kuò)散模型的多類<b class='flag-5'>異常</b><b class='flag-5'>檢測(cè)</b>工作

    基于transformer和自監(jiān)督學(xué)習(xí)的路面異常檢測(cè)方法分享

    鋪設(shè)異常檢測(cè)可以幫助減少數(shù)據(jù)存儲(chǔ)、傳輸、標(biāo)記和處理的壓力。本論文描述了一種基于Transformer和自監(jiān)督學(xué)習(xí)的新方法,有助于定位異常區(qū)域。
    的頭像 發(fā)表于 12-06 14:57 ?1216次閱讀
    基于transformer和自監(jiān)督<b class='flag-5'>學(xué)習(xí)</b>的路面<b class='flag-5'>異常</b><b class='flag-5'>檢測(cè)</b>方法分享

    【AIOps】一種全新的日志異常檢測(cè)評(píng)估框架:LightAD,相關(guān)成果已被軟工頂會(huì)ICSE 2024錄用

    需要更長(zhǎng)的時(shí)間來進(jìn)行日志預(yù)處理、模型訓(xùn)練和模型推斷,從而阻礙了它們?cè)谛枰焖俨渴鹑罩?b class='flag-5'>異常檢測(cè)服務(wù)的在線分布式云系統(tǒng)中的采用。 本文對(duì)現(xiàn)有的基于經(jīng)典機(jī)器學(xué)習(xí)和深度
    的頭像 發(fā)表于 11-29 17:40 ?504次閱讀

    深度學(xué)習(xí)算法和傳統(tǒng)機(jī)器視覺助力工業(yè)外觀檢測(cè)

    在很多人眼里,深度學(xué)習(xí)是一個(gè)非常神奇的技術(shù),是人工智能的未來,是機(jī)器學(xué)習(xí)的圣杯。今天深視創(chuàng)新帶您一起揭開他神秘的面紗,了解什么才是深度學(xué)習(xí)。
    的頭像 發(fā)表于 11-09 10:58 ?563次閱讀
    深度<b class='flag-5'>學(xué)習(xí)</b>算法和傳統(tǒng)<b class='flag-5'>機(jī)器</b>視覺助力工業(yè)外觀<b class='flag-5'>檢測(cè)</b>

    SAP半導(dǎo)體及光伏行業(yè)最佳業(yè)務(wù)實(shí)踐

    電子發(fā)燒友網(wǎng)站提供《SAP半導(dǎo)體及光伏行業(yè)最佳業(yè)務(wù)實(shí)踐.ppt》資料免費(fèi)下載
    發(fā)表于 11-02 14:32 ?0次下載
    SAP半導(dǎo)體及光伏行業(yè)最佳<b class='flag-5'>業(yè)務(wù)實(shí)踐</b>