0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

匿名和去識別化在數(shù)據隱私保護方面的重要性

如意 ? 來源:讀芯術微信公眾號 ? 作者:讀芯術微信公眾號 ? 2020-09-16 15:14 ? 次閱讀

匿名化是為了確保數(shù)據的隱私性,公司用它來保護敏感數(shù)據。這類數(shù)據包括:

私人數(shù)據

業(yè)務信息,如財務信息或商業(yè)秘密

機密信息,如軍事機密或政府信息

匿名化為遵循個人數(shù)據相關隱私條例提供了范例,個人數(shù)據和業(yè)務數(shù)據的重合之處就是客戶信息所在。但并非所有的業(yè)務數(shù)據都受監(jiān)管,本文將重點討論個人數(shù)據的保護。

匿名和去識別化在數(shù)據隱私保護方面的重要性

敏感數(shù)據類型示例

在歐洲,監(jiān)管機構將任何與某人(如你的名字)有關的信息定義為“個人數(shù)據”。不論形式,任何關聯(lián)到此人的信息都符合上述定義。從上世紀起,個人數(shù)據收集逐漸民主化,數(shù)據匿名化問題開始出現(xiàn)。隨著隱私條例在世界各地開始生效,這件事尤顯重要。

什么是數(shù)據匿名化,為何要關注它?

我們從經典定義開始。歐盟的《通用數(shù)據保護條例》(GDPR)是這樣定義對匿名信息的:“與識別或可識別自然人無關的信息,或以數(shù)據主體不能或不再可識別的方式匿名提供的個人信息。”

其中,“可識別”和“不再”至關重要。這不僅意味著你的名字不應再出現(xiàn)在數(shù)據中,也意味著不能從剩余數(shù)據中發(fā)現(xiàn)你是誰,這與再認同(有時也叫去匿名化)過程有關。

同樣,GDPR(契約中)陳述了一個重要事實:“……因此,數(shù)據保護不應適用于匿名信息”。所以,若你設法匿名數(shù)據,就不再受GDPR數(shù)據保護法的約束。

你可以執(zhí)行任何處理操作,如分析或數(shù)據貨幣化。這帶來了大量機會:

出售數(shù)據顯然是首選用途。在世界各地,隱私保護法正在限制個人數(shù)據交易,而匿名數(shù)據為公司提供了另一種選擇。

它帶來了合作機會。許多公司為了創(chuàng)新或研究而共享數(shù)據,匿名數(shù)據有助于降低風險。

它還為數(shù)據分析和機器學習創(chuàng)造了機會。在保持兼容性的同時運行敏感數(shù)據的操作正變得越來越復雜,匿名數(shù)據為統(tǒng)計分析和模型訓練提供了安全的原材料,前景一片光明。但實際上真正的匿名數(shù)據往往并不如愿。

數(shù)據隱私保護機制的范圍

數(shù)據的隱私保護有一個范圍。多年來,專家們研發(fā)了一系列集方法、機制和工具為一體的技術。這些技術生成了具有不同的匿名級別和不同再識別風險等級的數(shù)據??梢哉f,其范圍涵蓋了個人可識別數(shù)據乃至真正的匿名數(shù)據。

匿名和去識別化在數(shù)據隱私保護方面的重要性

數(shù)據隱私的范圍

左端,有包含直接個人識別碼的數(shù)據。通過這些元素,可以識別你的姓名、地址或電話號碼。另一端,則是GDPR引用的匿名數(shù)據。

如你所見,這些數(shù)據有一個中間范疇。它處于可識別數(shù)據和匿名數(shù)據之間,即假名數(shù)據和去識別數(shù)據。請注意,其界定仍有爭議。有些報告認為假名化是去識別化的一部分, 而另一些報告則將其排除在外。

生成這種“中間數(shù)據”的技術本身并無問題。它們能有效地將數(shù)據最小化。根據用例需求,它們將彼此關聯(lián),發(fā)揮用處。但切記,它們無法生成真正的匿名數(shù)據,它們的機制無法保證阻止再識別,所以將其生成的數(shù)據稱為“匿名數(shù)據”是一種誤導。

匿名和“匿名”

假名化和去識別化確實能在某些方面保護數(shù)據隱私。但根據GDPR的定義,它們無法生成匿名數(shù)據。

假名化技術從數(shù)據中刪除或替換直接個人標識碼,例如,從數(shù)據集中刪除所有名稱和電子郵件,你無法直接從假名數(shù)據中識別某人,不過可以間接識別。實際上,剩余數(shù)據通常會保留間接識別碼,組合這些信息后,就能創(chuàng)建直接識別碼,如出生日期,郵編,性別等。

就此而言,假名化在GDPR框架中有一個單獨定義:“……以以下方式處理個人數(shù)據,即在不使用附加信息的情況下,數(shù)據不再可以歸因于特定數(shù)據主體”。與匿名數(shù)據相反,假名數(shù)據符合GDPR的要求。

去識別化技術從數(shù)據中去除直接和間接的個人身份識別碼。理論上,去識別化數(shù)據和匿名化數(shù)據之間的界限很簡單。最新消息表明:有技術可保障永遠無法再識別數(shù)據。這是一種“疑罪從無”的情況,去識別化數(shù)據在未識別之前是匿名的。每當專家設法重新識別那些最初未識別出的數(shù)據時,他們都進一步推動了發(fā)展。

數(shù)據重新識別不斷重新定義匿名

上述機制類型對隱私保護沒有同等效力,因此如何處理這些數(shù)據很重要。公司定期發(fā)布或出售他們聲稱“匿名”的數(shù)據,但當他們使用的方法不能保證“匿名”時,就會帶來隱患。

眾多事件表明,假名化數(shù)據這種隱私保護機制仍有缺陷。數(shù)據中的間接識別碼會帶來巨大的再識別風險。隨著可用數(shù)據量的增長,相互參照數(shù)據集的機會也在增加:

1990年,麻省理工學院的研究生從去識別化醫(yī)療數(shù)據中重新確認了馬薩諸塞州州長的身份,她將這些信息與公用人口普查數(shù)據相互參照來確定患者身份。

2006年,作為研究計劃的一部分,美國在線公司(AOL)共享了去識別化搜索數(shù)據,研究人員能夠將搜索查詢與背后的個人聯(lián)系起來。

2009年,作為比賽的一部分,網飛(Netflix)發(fā)布了一個匿名電影評級數(shù)據集,德克薩斯州的研究人員成功重新識別了用戶。

同是2009年,研究人員僅利用公開信息就能預測出一個人的社會保險號。

最近研究表明,去識別化數(shù)據實際上可以被重新識別。比利時新魯汶大學和倫敦帝國理工學院的研究人員發(fā)現(xiàn):“使用15個人口統(tǒng)計屬性,在任何數(shù)據集中,99.98%的美國人都能被正確地重新識別?!?/p>

另一項針對匿名手機數(shù)據的研究表明:“四個時空點就足以唯一識別95%的個體用戶”。

技術日益進步,更多的數(shù)據正在被創(chuàng)建,研究人員正在努力劃定去識別化數(shù)據和匿名數(shù)據之間的界限。2017年,研究人員發(fā)表論文稱:“網絡瀏覽歷史只能通過公開數(shù)據鏈接到社交媒體上的個人資料?!?/p>

另一個令人擔憂的問題是個人資料的泄露,越來越多的個人信息遭到泄露。ForgeRock消費者身份泄露報告預測,2020年的信息泄露數(shù)量將超過去年,僅美國,2020年第一季度就有超過16億的客戶記錄被泄露。

分開處理的數(shù)據集無法重新識別,但與泄露數(shù)據結合起來,它會造成更大的威脅。哈佛大學的學生能夠利用泄露的數(shù)據重新識別去識別化數(shù)據。

總之,那些我們所認為的“匿名數(shù)據”往往并不是真正的匿名數(shù)據。并非所有的數(shù)據凈化方法都會生成真正的匿名數(shù)據。事事都各有優(yōu)點,但沒有一種能提供與匿名同等級別的隱私。隨著數(shù)據量的不斷增長,創(chuàng)建真正的匿名數(shù)據也越來越難,公司發(fā)布潛在可重新識別的個人數(shù)據的風險也在增加。
責編AJX

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 數(shù)據
    +關注

    關注

    8

    文章

    6820

    瀏覽量

    88748
  • 匿名
    +關注

    關注

    0

    文章

    6

    瀏覽量

    6774
  • 隱私保護
    +關注

    關注

    0

    文章

    297

    瀏覽量

    16430
收藏 人收藏

    評論

    相關推薦

    康謀分享 | 數(shù)據隱私匿名:PIPL與GDPR下,如何確保數(shù)據合規(guī)?(二)

    自動駕駛技術飛速發(fā)展,但數(shù)據隱私安全成攔路虎?別擔心,本文帶您深入剖析PIPL與GDPR在數(shù)據處理行為及基礎合法方面的異同之處,幫助您準確
    的頭像 發(fā)表于 10-30 09:30 ?179次閱讀
    康謀分享 | <b class='flag-5'>數(shù)據</b><b class='flag-5'>隱私</b>和<b class='flag-5'>匿名</b><b class='flag-5'>化</b>:PIPL與GDPR下,如何確保<b class='flag-5'>數(shù)據</b>合規(guī)?(二)

    數(shù)據分析在數(shù)字化中的作用

    重要性 數(shù)據分析是指使用統(tǒng)計和邏輯方法對數(shù)據進行處理和解釋的過程。它涉及到數(shù)據的收集、清洗、轉換、建模和解釋,目的是發(fā)現(xiàn)數(shù)據中的模式、趨勢
    的頭像 發(fā)表于 10-27 17:35 ?419次閱讀

    變電所繼電保護的作用與重要性

    。本文將詳細探討變電所繼電保護的功能、常見類型。 1. 繼電保護的作用與重要性 迅速隔離故障:在電力系統(tǒng)中,任何形式的故障如不即時處理都可能導致設備的損壞及廣泛的供電中斷。繼電保護裝置
    的頭像 發(fā)表于 10-04 14:24 ?244次閱讀

    康謀分享 | 數(shù)據隱私匿名:PIPL與GDPR下,如何確保數(shù)據合規(guī)?(一)

    自動駕駛技術的快速發(fā)展伴隨著數(shù)據隱私保護的嚴峻挑戰(zhàn)。PIPL和GDPR為自動駕駛數(shù)據合規(guī)設立了高標準。本篇文章將帶大家深入探討PIPL與GDPR的異同點,期望能夠幫助車企更好地理解并應
    的頭像 發(fā)表于 09-29 10:28 ?1328次閱讀
    康謀分享 | <b class='flag-5'>數(shù)據</b><b class='flag-5'>隱私</b>和<b class='flag-5'>匿名</b><b class='flag-5'>化</b>:PIPL與GDPR下,如何確保<b class='flag-5'>數(shù)據</b>合規(guī)?(一)

    動態(tài)代理IP的匿名和透明度,為主要考慮關鍵!

    動態(tài)代理IP的匿名和透明度是用戶選擇代理服務時需要考慮的關鍵因素。根據用戶的需求和場景,可以選擇不同匿名級別和透明度的代理服務來平衡隱私保護
    的頭像 發(fā)表于 09-20 07:36 ?217次閱讀
    動態(tài)代理IP的<b class='flag-5'>匿名</b><b class='flag-5'>性</b>和透明度,為主要考慮關鍵!

    工業(yè)智能網關在數(shù)據上云方面的作用、優(yōu)勢以及實施策略

    的管理效率、安全和智能水平。本文將詳細探討工業(yè)智能網關在數(shù)據上云方面的作用、優(yōu)勢以及實施策略。 工業(yè)智能網關概述 工業(yè)智能網關是一種用于工業(yè)環(huán)境中的設備,能夠連接多種網絡和設備,實
    的頭像 發(fā)表于 09-03 13:15 ?207次閱讀

    工業(yè)物聯(lián)網網關在數(shù)據融合與邊緣智能方面的作用

    在當今數(shù)字轉型的浪潮中,工業(yè)物聯(lián)網作為推動制造業(yè)智能、自動的關鍵力量,正深刻改變著傳統(tǒng)工業(yè)的生產模式與管理方式。而工業(yè)物聯(lián)網網關,作為連接物理世界與數(shù)字世界的橋梁,其重要性日益凸
    的頭像 發(fā)表于 08-09 17:44 ?295次閱讀

    平衡創(chuàng)新與倫理:AI時代的隱私保護和算法公平

    。為此,開發(fā)者應采用多元數(shù)據源,并定期進行算法公平的評估和調整。在就業(yè)篩選等敏感領域,透明度和公平的結合尤為重要,這需要確保篩選過程
    發(fā)表于 07-16 15:07

    藍牙模塊的安全隱私保護

    傳輸過程中的安全性問題,分析隱私保護方面的挑戰(zhàn)和解決方案,并介紹一些提高藍牙模塊安全隱私保護
    的頭像 發(fā)表于 06-14 16:06 ?476次閱讀

    求助,ADC接地的重要性?

    ADC接地的重要性
    發(fā)表于 06-04 07:56

    論RISC-V的MCU中UART接口的重要性

    RISC-V的MCU(微控制器單元)中UART(通用異步收發(fā)器)接口的重要性主要體現(xiàn)在以下幾個方面: 廣泛的適用 : UART接口是一種用于連接兩個計算機設備的接口,允許一個設備向另一個設備發(fā)送
    發(fā)表于 05-27 15:52

    集成芯片的重要性和必要

    集成芯片在現(xiàn)代科技和工業(yè)中占據著至關重要的地位,其重要性和必要主要體現(xiàn)在以下幾個方面。
    的頭像 發(fā)表于 03-18 15:17 ?949次閱讀

    PLC網關的重要性

    的關鍵組件。 一、PLC網關簡介 PLC網關是一種能夠連接PLC設備和物聯(lián)網系統(tǒng)的硬件設備。它一方面提供與PLC設備的通信接口,另一方面具備聯(lián)網功能,能夠將PLC設備的數(shù)據上傳到物聯(lián)網云平臺,實現(xiàn)設備的遠程監(jiān)控和管理。 二、PL
    的頭像 發(fā)表于 01-30 15:50 ?526次閱讀
    PLC網關的<b class='flag-5'>重要性</b>

    一眼看懂鴻蒙OS 應用隱私保護

    隨著移動終端及其相關業(yè)務(如移動支付、終端云等)的普及,用戶隱私保護重要性愈發(fā)突出。應用開發(fā)者在產品設計階段就需要考慮保護的用戶隱私,提高
    的頭像 發(fā)表于 01-26 17:04 ?797次閱讀
    一眼看懂鴻蒙OS 應用<b class='flag-5'>隱私</b><b class='flag-5'>保護</b>

    完整地平面的重要性

    完整地平面的重要性
    的頭像 發(fā)表于 11-28 16:54 ?901次閱讀
    完整地平<b class='flag-5'>面的</b><b class='flag-5'>重要性</b>