對于安防AI,看上去是AI,實際上最后是大數(shù)據(jù),大數(shù)據(jù)才是智能化的基礎。人工智能、深度學習、機器學習、大數(shù)據(jù)應用在安防AI中, 說到底都是對大數(shù)據(jù)的采集、建模和應用。本文大致說一下安防AI中,對于大數(shù)據(jù)的運用過程與環(huán)節(jié),讓大家有個大致的印象。
安防AI大數(shù)據(jù)流程三個環(huán)節(jié)
數(shù)據(jù)采集
數(shù)據(jù)采集,有說數(shù)據(jù)獲取,這是數(shù)據(jù)的來源,安防AI中這個數(shù)據(jù)是來源于視頻監(jiān)控系統(tǒng)中的視頻流,當然往大了說安防,還包括很多內(nèi)容,但是基本都是以視頻監(jiān)控為核心,這里主要指視頻監(jiān)控系統(tǒng)。
數(shù)據(jù)預處理
對于采集到的實時或者歷史視頻,是只能看不能應用的,要調用就得結構化,先給視頻流解碼,把視頻流還原成一張張圖片,再對圖片進行預處理。可能不同的公司對預處理包含的步驟內(nèi)容說法不太一致,我是以安軟慧視的技術負責人介紹為準。先對圖片進行目標清洗垃圾,清洗掉模糊的、不合尺寸的,目標無法識別的、無目標對象的等等。
當然,有些場景可能只有這樣的圖像,這需要用到另外一些圖像處理方法,和我們的主題相關但不是一回事。這樣我們就可以得到基本符合要求的圖像。然后對這些圖像中的目標對象進行檢測和分割,并改變目標的大小與標準圖片大小一致,目標對象包括人形、人臉、車形等,這樣就可以拿去訓練模型了。
模型訓練
對圖片中的目標對象進行識別,提取和構建模型,在安防AI中,需要的結構化描述是比較具體的,比如對人的描述就包括性別、年齡、發(fā)型特征、發(fā)飾、上衣款式特征、下衣款式特征、鞋帽款式特征、交通工具特征、隨身物品特征、同行人特征等一系列描述。對車的描述包括車牌號碼、廠牌、車身顏色、車輛品牌、車輛類型、車輛特征物(如:年檢標、掛飾、紙巾盒、遮陽板)等。
有了這些識別模型,就可以通過語義分析等技術對視頻數(shù)據(jù)進行分類處理存儲,并通過后端服務器的智能分析功能進行業(yè)務處理,將人、車、物的信息從數(shù)據(jù)中分離出來。這樣公安民警就可以進行快速檢索、條件搜圖(人)、以圖搜圖,再配以圖片的拍攝地點、時間等數(shù)據(jù),就可以進行軌跡查詢,再匹配一下大安防系統(tǒng)中的住宿、手機號碼、車票等大數(shù)據(jù),基本上嫌疑人就是插翅難逃,這對民警的破案效率將是百千倍的提升。這才是安防AI真正的價值所在。這在上一篇文章《安防AI大規(guī)模落地,解析一線場景及創(chuàng)新關鍵點》有過論述。
安防AI數(shù)據(jù)預處理技術及方法
目前常見的數(shù)據(jù)預處理技術
1)數(shù)據(jù)清理
數(shù)據(jù)清理例程就是通過填寫缺失值、光滑噪聲數(shù)據(jù)、識別或者刪除離群點,并且解決不一致性來進行“清理數(shù)據(jù)”。
2)數(shù)據(jù)集成
數(shù)據(jù)集成過程將來自多個數(shù)據(jù)源的數(shù)據(jù)集成到一起。
3)數(shù)據(jù)規(guī)約
數(shù)據(jù)規(guī)約是為了得到數(shù)據(jù)集的簡化表示。數(shù)據(jù)規(guī)約包括維規(guī)約和數(shù)值規(guī)約。
4)數(shù)據(jù)變換
通過變換使用規(guī)范化、數(shù)據(jù)離散化和概念分層等方法,使得數(shù)據(jù)的挖掘可以在多個抽象層面上進行。數(shù)據(jù)變換操作是提升數(shù)據(jù)挖掘效果的附加預處理過程。
數(shù)據(jù)清理方法
1)缺失值
對于缺失值的處理,一般是能補的就想辦法把它補上,實在補不上的就丟棄處理。通常的處理方法有:忽略元組、人工填寫缺失值、使用一個全局變量填充缺失值、使用屬性的中心度量填充缺失值、使用與給定元組屬同一類的所有樣本的屬性均值或中位數(shù)、使用最可能的值填充缺失值。
2)噪聲數(shù)據(jù)
噪聲是被測量變量的隨機誤差或方差。去除噪聲、使數(shù)據(jù)“光滑”的技術有分箱、回歸、離群點分析等。
3)數(shù)據(jù)清理過程
這個環(huán)節(jié)主要包括數(shù)據(jù)預處理、清理方法、校驗清理方法、執(zhí)行清理工具及數(shù)據(jù)歸檔。數(shù)據(jù)清理的原理是通過分析“無效數(shù)據(jù)”產(chǎn)生的原因和存在形式,利用現(xiàn)有的技術手段和方法去清理,將“無效數(shù)據(jù)”轉化為滿足數(shù)據(jù)質量或應用要求的數(shù)據(jù),從而提高數(shù)據(jù)集的數(shù)據(jù)質量。常用的工具有Excel、Access、SPSS Modeler、SAS、SPSS Statistics等。
4)模型構建數(shù)據(jù)統(tǒng)計分析
數(shù)據(jù)統(tǒng)計為模型構建提供基礎,只有通過數(shù)據(jù)統(tǒng)計分析探索到了數(shù)據(jù)中隱藏的規(guī)律,深度學習才有意義,人工智能才有可能。數(shù)據(jù)統(tǒng)計又包括數(shù)據(jù)分析與結果分析,基本的分析方法有:對比分析法、分組分析法、交叉分析法、因素分析法、結構分析法、漏斗圖分析法、矩陣關聯(lián)分析法、綜合評價分析法等。
高級的分析方法有:主成分分析法、因子分析法、對應分析法、相關分析法、回歸分析法、聚類分析法、判別分析法、時間序列等。這些類別并不是獨一使用的,往往是混合使用的,然后再通過進一步的分析對比從中挑選某些組合模型。
5)數(shù)據(jù)可視化
數(shù)據(jù)可視化,就是通過一些可視化圖形或者報表形式進行展示,增強對分析結果的理解。再針對結果進行進一步的數(shù)據(jù)再分析,使得整個業(yè)務環(huán)節(jié)形成閉環(huán)。只有閉環(huán)的數(shù)據(jù)才能真正發(fā)揮出深度學習的效用。
安防AI大數(shù)據(jù)的應用
安防大數(shù)據(jù)的應用當前是圍繞提升破案率和提升警務工作效率為中心的,要想在安防數(shù)據(jù)的基礎上開發(fā)出優(yōu)秀的應用,必須要深入了解警務工作流程,從接處警、現(xiàn)場勘查、情報研判、應急指揮、關聯(lián)碰撞、合成作戰(zhàn),再到各類型警用裝備間的互聯(lián)互通,再到各警種間的配合,再到各警種業(yè)務數(shù)據(jù)庫間的融合。這些都要有詳細地了解,才能發(fā)現(xiàn)針對刑偵破案、治安防控、交通管理的應用間的差異。
舉例說,比如針對嫌疑人的追蹤,可能是臉,但是大部分時候視頻是識別不出臉的,這是事實,人臉識別僅在車站、機場、銀行等卡點場景才有用。但是絕大多數(shù)逃犯都是有點反偵察能力的,不是看到攝像頭就繞著走,就是故意遮擋不讓看,或者干脆等到天黑再走。
這時候能運用到的主要就是通過嫌疑人的外形特征進行追蹤,以圖搜圖配上區(qū)域范圍選擇、時間段選擇,再配上同行人特征、隨行物品特征、工具特征,就可以有效地對嫌疑人進行高效篩選,再通過綜合情報進行軌跡研判,這種情況下,嫌疑人幾乎就是甕中之鱉,上天無路入地無門。如果再出現(xiàn)小朋友老年人走失,想找到就是分分鐘的事,再也不會出現(xiàn)讓發(fā)動大批警力沿街查找,動輒耗費數(shù)十個小時的情況了。這樣,公安會不喜歡么?
說到底,大數(shù)據(jù)最終是為應用服務的,只有最后真正提高了公安民警的工作效率和破案率,才能證明安防AI的價值和意義。這就要求我們既要懂AI業(yè)務,又要懂公安業(yè)務。脫離了這兩者,想讓安防AI得到大面積推廣是連想都不要想的。
評論
查看更多