0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

數(shù)據(jù)質(zhì)量問(wèn)題的分析和改進(jìn)

茶棚小二a ? 來(lái)源:thoughtworks ? 作者:van ? 2022-10-19 19:02 ? 次閱讀

在如今火爆的數(shù)智化時(shí)代,企業(yè)都在利用大數(shù)據(jù)創(chuàng)新業(yè)務(wù)、獲得價(jià)值;然而,數(shù)據(jù)能否更好地賦能業(yè)務(wù),取決于企業(yè)數(shù)據(jù)質(zhì)量的好壞。好的數(shù)據(jù)質(zhì)量,經(jīng)過(guò)數(shù)據(jù)分析、挖掘、機(jī)器學(xué)習(xí)等手段,可以更好地輔助業(yè)務(wù)決策、幫助企業(yè)降本增效;差的數(shù)據(jù)質(zhì)量,從數(shù)據(jù)中獲得的價(jià)值有限,甚至?xí)`導(dǎo)做出錯(cuò)誤的業(yè)務(wù)決策,從而給企業(yè)帶來(lái)災(zāi)難性的后果。

那么,一個(gè)企業(yè)的數(shù)據(jù)質(zhì)量如何,如何評(píng)估?常見(jiàn)的數(shù)據(jù)質(zhì)量問(wèn)題都有哪些?這些問(wèn)題是什么原因造成的?

數(shù)據(jù)質(zhì)量評(píng)估維度

在評(píng)價(jià)企業(yè)數(shù)據(jù)質(zhì)量的好壞時(shí),首先需要定義評(píng)估的維度,通常較為重要的數(shù)據(jù)質(zhì)量維度有以下6個(gè):

  • 數(shù)據(jù)唯一性: 是指數(shù)據(jù)唯一,不存在重復(fù)記錄。即:不會(huì)出現(xiàn)一物多碼,一碼多物的情況。例如:主鍵唯一性,同一個(gè)ID不會(huì)重復(fù)記錄。
  • 數(shù)據(jù)完整性: 是指數(shù)據(jù)在創(chuàng)建、處理流轉(zhuǎn)過(guò)程中無(wú)缺失和遺漏,包括實(shí)體完整、屬性完整、記錄完整和字段值完整。例如:?jiǎn)T工的工號(hào)不可為空。
  • 數(shù)據(jù)準(zhǔn)確性: 是指真實(shí)、準(zhǔn)確地記錄原始數(shù)據(jù),無(wú)虛假數(shù)據(jù)及信息。數(shù)據(jù)要準(zhǔn)確反映其所建模的"真實(shí)世界"的實(shí)體。例如:在業(yè)務(wù)系統(tǒng)上填寫(xiě)信息時(shí),手誤輸錯(cuò)了新車(chē)類(lèi)型信息,造成了數(shù)據(jù)庫(kù)里存在的信息與真實(shí)世界不一樣。
  • 數(shù)據(jù)一致性: 是指數(shù)據(jù)是否遵循了統(tǒng)一的規(guī)范、是否符合邏輯。例如:同一車(chē)型所對(duì)應(yīng)的名稱(chēng)在不同系統(tǒng)中保持一致。
  • 數(shù)據(jù)及時(shí)性: 是指及時(shí)記錄和傳遞相關(guān)數(shù)據(jù),從而滿(mǎn)足業(yè)務(wù)對(duì)信息獲取的時(shí)間要求。主要指數(shù)據(jù)提取要及時(shí)、傳送要及時(shí)、轉(zhuǎn)換要及時(shí)、加載和展現(xiàn)要及時(shí)。
  • 數(shù)據(jù)有效性: 指數(shù)據(jù)的值、格式和展現(xiàn)形式符合數(shù)據(jù)定義和數(shù)據(jù)業(yè)務(wù)定義的要求。例如:手機(jī)號(hào)要符合全球手機(jī)號(hào)碼編碼規(guī)則。

數(shù)據(jù)質(zhì)量問(wèn)題分析原因

從數(shù)據(jù)的整個(gè)生命周期來(lái)看,任何一環(huán)節(jié)都有可能產(chǎn)生數(shù)據(jù)問(wèn)題。在數(shù)據(jù)的采集階段,數(shù)據(jù)的真實(shí)性、準(zhǔn)確性、完整性、一致性等會(huì)影響數(shù)據(jù)質(zhì)量。在數(shù)據(jù)的加工、存儲(chǔ)階段,也涉及到對(duì)數(shù)據(jù)的修改,也可能引發(fā)數(shù)據(jù)質(zhì)量問(wèn)題。所以,業(yè)務(wù)、技術(shù)、管理等多方面的因素都有可能會(huì)影響到數(shù)據(jù)質(zhì)量。

業(yè)務(wù)問(wèn)題

  • 業(yè)務(wù)需求不清晰

    在業(yè)務(wù)需求不清晰的情況下,很容易造成由于理解偏差,最終導(dǎo)致結(jié)果數(shù)據(jù)有問(wèn)題。

  • 需求頻繁變更

    需求一旦變更,其中數(shù)據(jù)采集、數(shù)據(jù)處理、數(shù)據(jù)存儲(chǔ)等環(huán)節(jié)就可能會(huì)受到影響,稍有不慎引入Bug,便造成數(shù)據(jù)質(zhì)量問(wèn)題。

  • 數(shù)據(jù)填報(bào)缺失或不準(zhǔn)確

    業(yè)務(wù)系統(tǒng)側(cè),在數(shù)據(jù)錄入時(shí),漏填或填錯(cuò)信息,造成數(shù)據(jù)的質(zhì)量問(wèn)題。

  • 數(shù)據(jù)作假

    為了提高或降低考核指標(biāo),對(duì)一些數(shù)據(jù)進(jìn)行人為造假,使得數(shù)據(jù)真實(shí)性無(wú)法保證。

技術(shù)問(wèn)題

  • 數(shù)據(jù)庫(kù)結(jié)構(gòu)設(shè)計(jì)問(wèn)題

    例如:數(shù)據(jù)庫(kù)表結(jié)構(gòu)、數(shù)據(jù)庫(kù)約束條件、數(shù)據(jù)校驗(yàn)規(guī)則的設(shè)計(jì)開(kāi)發(fā)不合理,造成數(shù)據(jù)錄入無(wú)法校驗(yàn)或校驗(yàn)不當(dāng),引起數(shù)據(jù)重復(fù)、不完整、不準(zhǔn)確。

  • 數(shù)據(jù)采集問(wèn)題

    從業(yè)務(wù)系統(tǒng)采集過(guò)來(lái)的數(shù)據(jù)本身就有一些不完整、重復(fù)、不規(guī)范,如果沒(méi)有清洗、及時(shí)糾錯(cuò)或清洗代碼有Bug,就會(huì)造成有質(zhì)量問(wèn)題的數(shù)據(jù)進(jìn)入。

  • 數(shù)據(jù)處理問(wèn)題

    數(shù)據(jù)在傳遞、數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)存儲(chǔ)過(guò)程中,任一環(huán)節(jié)有技術(shù)問(wèn)題,都有可能造成數(shù)據(jù)質(zhì)量問(wèn)題。

  • 各系統(tǒng)孤立開(kāi)發(fā)

    業(yè)務(wù)系統(tǒng)各自為政,孤立開(kāi)發(fā),系統(tǒng)之間的數(shù)據(jù)孤島、數(shù)據(jù)不一致問(wèn)題嚴(yán)重。

管理問(wèn)題

企業(yè)管理缺乏數(shù)據(jù)思維, 沒(méi)有認(rèn)識(shí)到數(shù)據(jù)質(zhì)量的重要性。沒(méi)有進(jìn)行統(tǒng)一數(shù)據(jù)管理,沒(méi)有明確的數(shù)據(jù)質(zhì)量目標(biāo),也沒(méi)有制定數(shù)據(jù)質(zhì)量相關(guān)的政策和制度等。

數(shù)據(jù)質(zhì)量問(wèn)題改進(jìn)指導(dǎo)

正如上述所列,造成數(shù)據(jù)質(zhì)量差的原因有很多;那么,面對(duì)企業(yè)數(shù)據(jù)質(zhì)量差的問(wèn)題,如何改進(jìn)?借鑒PDCA循環(huán)(又名戴明環(huán))進(jìn)行數(shù)據(jù)質(zhì)量持續(xù)改進(jìn),以達(dá)最終數(shù)據(jù)質(zhì)量目標(biāo)。

PDCA循環(huán)

PDCA是一套“目標(biāo)管理”流程,通過(guò)規(guī)劃、執(zhí)行、檢查、行動(dòng)四階段,確保每次的目標(biāo)都能達(dá)成。PDCA循環(huán)在質(zhì)量管理中得到廣泛的應(yīng)用。

PDCA的四個(gè)階段:

  • 計(jì)劃 PLAN

    先確定數(shù)據(jù)質(zhì)量目標(biāo),可通過(guò)數(shù)據(jù)質(zhì)量評(píng)估標(biāo)準(zhǔn)為當(dāng)前企業(yè)數(shù)據(jù)質(zhì)量進(jìn)行評(píng)估,設(shè)定改進(jìn)目標(biāo)。 對(duì)照目標(biāo)制定計(jì)劃與實(shí)施方案。在制定實(shí)施方案時(shí),每1項(xiàng)措施要符合5W1H,即:為什么制定該措施?達(dá)到什么目標(biāo)?在何處執(zhí)行?由誰(shuí)負(fù)責(zé)完成?什么時(shí)間完成?怎么完成? 比如:一項(xiàng)措施是為企業(yè)制定并執(zhí)行數(shù)據(jù)標(biāo)準(zhǔn)。

  • 實(shí)施 DO

    依據(jù)上一步計(jì)劃與實(shí)施方案進(jìn)行執(zhí)行。 比如:制定好數(shù)據(jù)標(biāo)準(zhǔn),推廣到各部門(mén)執(zhí)行。eg. 某車(chē)企會(huì)員類(lèi)型(企業(yè)代碼標(biāo)準(zhǔn)、2位編碼):01 普通卡、02 黃金卡、03 鉆石、04 超級(jí)VIP卡;車(chē)保險(xiǎn)種類(lèi)代碼(外部代碼標(biāo)準(zhǔn)、4位編碼):10100 交強(qiáng)險(xiǎn)、10200 商業(yè)車(chē)險(xiǎn) 等等。

  • 檢查 CHECK

    完成一輪的實(shí)施之后,進(jìn)行檢查,對(duì)比當(dāng)前實(shí)際情況與預(yù)期目標(biāo)的差距。

  • 行動(dòng) ACT
    對(duì)于本輪的經(jīng)驗(yàn)和措施形成標(biāo)準(zhǔn),標(biāo)準(zhǔn)化下來(lái),持續(xù)運(yùn)行,防止質(zhì)量倒退。 對(duì)于沒(méi)有達(dá)到預(yù)期效果,分析原因,制定下一步行動(dòng),繼續(xù)下一輪的PDCA循環(huán)。

所有措施不可能在一個(gè)PDCA循環(huán)中全部解決,遺留的措施會(huì)自動(dòng)轉(zhuǎn)進(jìn)下一個(gè)PDCA循環(huán),周而復(fù)始,螺旋上升。

改進(jìn)措施

有了PDCA循環(huán)的指引,透過(guò)PDCA環(huán)高效完成達(dá)到目標(biāo)的所有措施,持續(xù)改進(jìn)數(shù)據(jù)質(zhì)量。在制定有效措施方面,始終要遵循:及時(shí)發(fā)現(xiàn)問(wèn)題 -> 立即解決問(wèn)題-> 提前預(yù)防問(wèn)題;因此,歸納改進(jìn)措施如下。

事前預(yù)防
  • 提高全員數(shù)據(jù)質(zhì)量意識(shí)。加強(qiáng)培訓(xùn)、Session分享、或出題考試等,通過(guò)各種手段培養(yǎng)員工重視數(shù)據(jù)質(zhì)量,了解數(shù)據(jù)對(duì)下游所產(chǎn)生的影響。
  • 制定數(shù)據(jù)規(guī)范、數(shù)據(jù)質(zhì)量標(biāo)準(zhǔn)、元數(shù)據(jù)管理等。
  • 建立自動(dòng)系統(tǒng),數(shù)據(jù)輸入控制,防止無(wú)效或不準(zhǔn)確數(shù)據(jù)進(jìn)入系統(tǒng)。
  • 制定正式的變更控制、把關(guān)過(guò)程,防止正常處理流程之外直接更改數(shù)據(jù)。
  • 制定相關(guān)制度來(lái)避免數(shù)據(jù)問(wèn)題,如:嚴(yán)禁無(wú)記錄無(wú)跟蹤人為篡改數(shù)據(jù)。
事中監(jiān)控

問(wèn)題發(fā)生,及時(shí)糾正,最大限度地降低糾正措施成本和風(fēng)險(xiǎn)。

  • 構(gòu)建日志管理體系,問(wèn)題及時(shí)追蹤處理。
  • 構(gòu)建數(shù)據(jù)異常處理機(jī)制與告警辦法
  • 創(chuàng)建數(shù)據(jù)質(zhì)量監(jiān)測(cè)平臺(tái),自動(dòng)執(zhí)行數(shù)據(jù)質(zhì)量檢查和審計(jì)過(guò)程。
  • 問(wèn)題發(fā)生,及時(shí)數(shù)據(jù)修正:程序自動(dòng)修正、程序自動(dòng)發(fā)現(xiàn)且人工修正。
  • 建立數(shù)據(jù)質(zhì)量的流程化控制體系,對(duì)數(shù)據(jù)的采集、加工、存儲(chǔ)等環(huán)節(jié)進(jìn)行流程化控制。
事后完善
  • 問(wèn)題發(fā)生解決后,要復(fù)盤(pán),完善相應(yīng)的預(yù)防措施、數(shù)據(jù)規(guī)范、數(shù)據(jù)管理制定與政策等等
  • 定期評(píng)估度量,落實(shí)行動(dòng)項(xiàng),逐步提升數(shù)據(jù)質(zhì)量。

寫(xiě)到這里,想必大家對(duì)于數(shù)據(jù)質(zhì)量問(wèn)題的分析與改進(jìn)有了一定的認(rèn)識(shí)??傊涀∠旅孢@句話(huà):

【首先】數(shù)據(jù)質(zhì)量評(píng)估 -> 發(fā)現(xiàn)問(wèn)題,

【其次】問(wèn)題根因分析 -> 分析問(wèn)題,

【最后】戴明環(huán)方法改進(jìn) -> 解決問(wèn)題。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    電能質(zhì)量問(wèn)題包括哪些現(xiàn)象

    在現(xiàn)代電力系統(tǒng)中,電能質(zhì)量的優(yōu)劣直接關(guān)系到工業(yè)生產(chǎn)效率、設(shè)備壽命以及日常生活質(zhì)量等多個(gè)方面。常見(jiàn)的電能質(zhì)量問(wèn)題包括電壓波動(dòng)與閃變、諧波污染以及三相不平衡等。這些問(wèn)題不僅影響設(shè)備的正常運(yùn)行,還可能導(dǎo)致
    的頭像 發(fā)表于 08-30 10:03 ?183次閱讀

    SMT加工中常見(jiàn)的錫膏印刷質(zhì)量問(wèn)題有哪些?

    在SMT加工中錫膏印刷的質(zhì)量也是能夠直接影響到產(chǎn)品整體質(zhì)量的因素之一,并且在SMT貼片加工中大多焊接缺陷都來(lái)自錫膏印刷的質(zhì)量問(wèn)題,在高密度高精度的SMT貼片中尤為明顯,常見(jiàn)的錫膏印刷不良主要有少錫
    的頭像 發(fā)表于 06-14 15:50 ?326次閱讀
    SMT加工中常見(jiàn)的錫膏印刷<b class='flag-5'>質(zhì)量問(wèn)題</b>有哪些?

    WP4000變頻功率分析儀對(duì)電能質(zhì)量特征量是如何計(jì)算測(cè)量的?

    電能質(zhì)量 即電力系統(tǒng)中電能的質(zhì)量,在現(xiàn)代電力系統(tǒng)中,由于大量的變頻器的使用產(chǎn)生諧波導(dǎo)致的電壓波形畸變,以及電壓暫降、暫升和短時(shí)中斷等,都成為很重要的電能質(zhì)量問(wèn)題。WP4000變頻功率分析
    的頭像 發(fā)表于 06-05 09:42 ?360次閱讀
    WP4000變頻功率<b class='flag-5'>分析</b>儀對(duì)電能<b class='flag-5'>質(zhì)量</b>特征量是如何計(jì)算測(cè)量的?

    淺談多線(xiàn)合用牽引變電所電能質(zhì)量實(shí)測(cè)分析

    功率因數(shù)、三相電壓不平衡、諧波等電能質(zhì)量問(wèn)題,然后基于實(shí)測(cè)數(shù)據(jù)對(duì)合蚌客專(zhuān)3座牽引變電所電能質(zhì)量進(jìn)行了分析。通過(guò)分析得出,牽引變電所電能
    的頭像 發(fā)表于 04-16 16:39 ?275次閱讀
    淺談多線(xiàn)合用牽引變電所電能<b class='flag-5'>質(zhì)量</b>實(shí)測(cè)<b class='flag-5'>分析</b>

    電能質(zhì)量分析儀功能介紹

    保定聯(lián)智電氣的電能質(zhì)量分析儀器是專(zhuān)門(mén)用于檢測(cè)電網(wǎng)中發(fā)生波形畸變、諧波含量和三相不平衡等電能質(zhì)量問(wèn)題的高精度測(cè)試儀器;同時(shí)還具備電參量測(cè)試、諧波判斷、矢量分析、歷史查閱的功能。 電能質(zhì)量分析
    的頭像 發(fā)表于 03-22 08:55 ?369次閱讀

    超載服務(wù)電能質(zhì)量事件案例分析

    電能質(zhì)量檢測(cè)儀MAVOWATT 230可以滿(mǎn)足安全,直觀,靈活地分析電能質(zhì)量以及功率能耗需求。
    的頭像 發(fā)表于 01-24 14:46 ?324次閱讀
    超載服務(wù)電能<b class='flag-5'>質(zhì)量</b>事件案例<b class='flag-5'>分析</b>

    管殼類(lèi)產(chǎn)品縫焊過(guò)程質(zhì)量問(wèn)題分析及解決方法

    共讀好書(shū) 閆旭冬 李文浩 王雁 ( 中國(guó)電子科技集團(tuán)公司第二研究所) 摘要: 針對(duì)微電子管殼類(lèi)產(chǎn)品的高氣密性封裝,總結(jié)了對(duì)不同型號(hào)產(chǎn)品使用全自動(dòng)平行縫焊機(jī)進(jìn)行焊接過(guò)程中出現(xiàn)的質(zhì)量問(wèn)題,并提出了相應(yīng)
    的頭像 發(fā)表于 01-17 17:10 ?320次閱讀
    管殼類(lèi)產(chǎn)品縫焊過(guò)程<b class='flag-5'>質(zhì)量問(wèn)題</b><b class='flag-5'>分析</b>及解決方法

    電能質(zhì)量檢查儀器有哪些類(lèi)型

    隨著電力系統(tǒng)的發(fā)展和電氣設(shè)備的廣泛應(yīng)用,電能質(zhì)量問(wèn)題日益凸顯。為了保障電力供應(yīng)的可靠性和電氣設(shè)備的正常運(yùn)行,人們對(duì)電能質(zhì)量的監(jiān)測(cè)和分析變得越來(lái)越重要。而電能質(zhì)量檢查儀器就成為了這一過(guò)程
    的頭像 發(fā)表于 12-25 13:29 ?414次閱讀
    電能<b class='flag-5'>質(zhì)量</b>檢查儀器有哪些類(lèi)型

    LabVIEW開(kāi)發(fā)電能質(zhì)量監(jiān)測(cè)系統(tǒng)

    等。該系統(tǒng)通過(guò)疊加不同波形(如正弦波和三角波)來(lái)生成暫態(tài)擾動(dòng)信號(hào),提供了一種創(chuàng)新的方法來(lái)模擬電能質(zhì)量問(wèn)題。 信號(hào)存儲(chǔ)與分析:系統(tǒng)的關(guān)鍵創(chuàng)新在于其能夠?qū)崟r(shí)存儲(chǔ)擾動(dòng)信號(hào)的波形圖,用戶(hù)可以根據(jù)需要設(shè)置存儲(chǔ)
    發(fā)表于 12-15 19:19

    電能質(zhì)量分析儀的作用有哪些呢?

    電能質(zhì)量分析儀是一種專(zhuān)門(mén)用于分析電網(wǎng)運(yùn)行質(zhì)量的專(zhuān)用儀表,可以準(zhǔn)確快速地測(cè)量與功耗和發(fā)電相關(guān)的各種參數(shù),包括電壓、電流、相角、功率因數(shù)、有功功率、頻率等多種電參量。同時(shí),它還具備電參量測(cè)試和矢量
    的頭像 發(fā)表于 12-04 14:25 ?921次閱讀
    電能<b class='flag-5'>質(zhì)量分析</b>儀的作用有哪些呢?

    電能質(zhì)量分析儀:高端便攜式電力檢測(cè)利器

    隨著電力系統(tǒng)的不斷發(fā)展,電能質(zhì)量問(wèn)題日益凸顯。為了確保電力系統(tǒng)的穩(wěn)定運(yùn)行,對(duì)電能質(zhì)量進(jìn)行實(shí)時(shí)、準(zhǔn)確的監(jiān)測(cè)和分析顯得尤為重要。在這個(gè)背景下,一款集諧波分析、波形采樣與電壓上沖下陷記錄、閃
    的頭像 發(fā)表于 11-15 13:58 ?714次閱讀
    電能<b class='flag-5'>質(zhì)量分析</b>儀:高端便攜式電力檢測(cè)利器

    EPS消防應(yīng)急電源常見(jiàn)三類(lèi)質(zhì)量問(wèn)題

    電子發(fā)燒友網(wǎng)站提供《EPS消防應(yīng)急電源常見(jiàn)三類(lèi)質(zhì)量問(wèn)題.pdf》資料免費(fèi)下載
    發(fā)表于 11-14 10:11 ?0次下載
    EPS消防應(yīng)急電源常見(jiàn)三類(lèi)<b class='flag-5'>質(zhì)量問(wèn)題</b>

    電能質(zhì)量分析儀:守護(hù)電力安全的綠色衛(wèi)士

    在現(xiàn)代社會(huì),電力已經(jīng)成為人們生活和工業(yè)生產(chǎn)中不可或缺的重要能源。然而,隨著電力負(fù)荷的不斷增加,電能質(zhì)量問(wèn)題也日益凸顯。為了確保電力系統(tǒng)的穩(wěn)定運(yùn)行和設(shè)備的安全可靠,電能質(zhì)量分析儀應(yīng)運(yùn)而生。
    的頭像 發(fā)表于 10-20 10:09 ?406次閱讀