工業(yè)大數(shù)據(jù)具有一般大數(shù)據(jù)的特征(海量性、多樣性等),此基礎(chǔ)上具有 價(jià)值性 、 實(shí)時(shí)性 、 準(zhǔn)確性 、 閉環(huán)性 四個(gè)典型的特征。
工業(yè)大數(shù)據(jù)與互聯(lián)網(wǎng)大數(shù)據(jù)最大的區(qū)別在于工業(yè)大數(shù)據(jù)有非常強(qiáng)的目的性,而互聯(lián)網(wǎng)大數(shù)據(jù)更多的是一種關(guān)聯(lián)的挖掘,是更加發(fā)散的一種分析。除此之外,兩者在數(shù)據(jù)的特征和面臨的問題方面也有不同。有別于互聯(lián)網(wǎng)大數(shù)據(jù),工業(yè)大數(shù)據(jù)的分析技術(shù)核心要解決 “3B” 問題:
1、Below Surface —— 隱匿性,即需要洞悉背后的意義
工業(yè)環(huán)境中的大數(shù)據(jù)與互聯(lián)網(wǎng)大數(shù)據(jù)相比,最重要的不同在于對(duì)數(shù)據(jù)特征的提取上面,工業(yè)大數(shù)據(jù)注重特征背后的物理意義以及特征之間關(guān)聯(lián)性的機(jī)理邏輯,而互聯(lián)網(wǎng)大數(shù)據(jù)則傾向于僅僅依賴統(tǒng)計(jì)學(xué)工具挖掘?qū)傩灾g的相關(guān)性。
2、Broken —— 碎片化,即需要避免斷續(xù)、注重時(shí)效性
相對(duì)于互聯(lián)網(wǎng)大數(shù)據(jù)的量,工業(yè)大數(shù)據(jù)更注重?cái)?shù)據(jù)的全,即面向應(yīng)用要求具有盡可能全面的使用樣本,以覆蓋工業(yè)過程中的各類變化條件、保障從數(shù)據(jù)中能夠提取以反映對(duì)象真實(shí)狀態(tài)的信息全面性。因此,工業(yè)大數(shù)據(jù)一方面需要在后端的分析方法上克服數(shù)據(jù)碎片化帶來的困難,利用特征提取等手段將這些數(shù)據(jù)轉(zhuǎn)化為有用的信息,另一方面,更是需要從數(shù)據(jù)獲取的前端設(shè)計(jì)中以價(jià)值需求為導(dǎo)向制定數(shù)據(jù)標(biāo)準(zhǔn),進(jìn)而在數(shù)據(jù)與信息流通的平臺(tái)中構(gòu)建統(tǒng)一的數(shù)據(jù)環(huán)境。
3、Bad Quality —— 低質(zhì)性,即需要提高數(shù)據(jù)質(zhì)量、滿足低容錯(cuò)性
數(shù)據(jù)碎片化缺陷來源的另一方面也顯示出對(duì)于數(shù)據(jù)質(zhì)量的擔(dān)憂。即數(shù)據(jù)的數(shù)量并無法保障數(shù)據(jù)的質(zhì)量,這就可能導(dǎo)致數(shù)據(jù)的低可用率,因?yàn)榈唾|(zhì)量的數(shù)據(jù)可能直接影響到分析過程而導(dǎo)致結(jié)果無法利用。
但互聯(lián)網(wǎng)大數(shù)據(jù)則不同,其可以只針對(duì)數(shù)據(jù)本身做挖掘、關(guān)聯(lián)而不考慮數(shù)據(jù)本身的意義,即挖掘到什么結(jié)果就是什么結(jié)果。最典型的就是經(jīng)過超市購物習(xí)慣的數(shù)據(jù)挖掘后啤酒貨架就可以擺放在尿不濕貨架的對(duì)面,而不用考慮他們之間有什么機(jī)理性的邏輯關(guān)系 ;換句話說,相比于互聯(lián)網(wǎng)大數(shù)據(jù)通常并不要求有多么精準(zhǔn)的結(jié)果推送,工業(yè)大數(shù)據(jù)對(duì)預(yù)測(cè)和分析結(jié)果的容錯(cuò)率遠(yuǎn)遠(yuǎn)比互聯(lián)網(wǎng)大數(shù)據(jù)低的多。
互聯(lián)網(wǎng)大數(shù)據(jù)在進(jìn)行預(yù)測(cè)和決策時(shí),僅僅考慮的是兩個(gè)屬性之間的關(guān)聯(lián)是否具有統(tǒng)計(jì)顯著性,其中的噪聲和個(gè)體之間的差異在樣本量足夠大時(shí)都可以被忽略,這樣給出的預(yù)測(cè)結(jié)果的準(zhǔn)確性就會(huì)大打折扣。
比如當(dāng)我覺得有 70% 的顯著性應(yīng)該給某個(gè)用戶推薦 A 類電影,即使用戶并非真正喜歡這類電影也不會(huì)造成太嚴(yán)重的后果。但是在工業(yè)環(huán)境中,如果僅僅通過統(tǒng)計(jì)的顯著性給出分析結(jié)果,哪怕僅僅一次的失誤都可能造成嚴(yán)重的后果。
-
工業(yè)大數(shù)據(jù)
+關(guān)注
關(guān)注
0文章
72瀏覽量
7821 -
互聯(lián)網(wǎng)大數(shù)據(jù)
+關(guān)注
關(guān)注
0文章
7瀏覽量
1379
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論