電子發(fā)燒友App

硬聲App

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示
創(chuàng)作
電子發(fā)燒友網(wǎng)>電子資料下載>電子論文>移動(dòng)通信技術(shù)論文>采用熵的多維K-匿名劃分方法

采用熵的多維K-匿名劃分方法

2008-11-20 | rar | 333 | 次下載 | 2積分

資料介紹

K-匿名是數(shù)據(jù)發(fā)布應(yīng)用場(chǎng)景下重要的隱私保護(hù)模型。近年來數(shù)據(jù)集K-匿名化的算法得到廣泛的研究,Median Mondrian算法是目前唯一的多維K-匿名劃分方法。文中研究了Median Mondrian算法,指出其不能有效地平衡數(shù)據(jù)劃分精度與數(shù)據(jù)隱私安全性之間的矛盾,由此提出基于熵測(cè)度機(jī)制的多維K-匿名劃分方法以及評(píng)估K-匿名化結(jié)果安全性的測(cè)量標(biāo)準(zhǔn)。實(shí)驗(yàn)表明該算法是可行的,能有效地提高數(shù)據(jù)安全性。
關(guān) 鍵 詞 熵; K-匿名; 多維劃分; 準(zhǔn)標(biāo)識(shí)符
中圖分類號(hào) TP309.2 文獻(xiàn)標(biāo)識(shí)碼 A
Multidimensional K-anonymity Partition Method Using Entropy
YAN Hua,LIU Gui-song
(Computational Intelligence Laboratory, University of Electronic Science and Technology of China Chengdu 610054)
Abstract K-anonymity is an important privacy preserving model in the data publishing scenario. The algorithms on dataset K-anonymization are researched extensively in recent years, Median Mondrian algorithm is the only multidimensional K-anonymity partition method. However, our research shows that Median Mondrian algorithm is not well-balanced on dealing with the contradiction between data partition precision and data privacy preserving. In this paper, we propose an entropy-based multidimensional K-anonymity partition method and a new evaluation measure on K-anonymization results. The experimental results show that our new method is feasible and preserves the privacy much more efficiently than Median Mondrian algorithm.
Key words entropy; K-anonymity; multidimensional partition; quasi-identifier

近年來,數(shù)據(jù)的安全與隱私問題已經(jīng)成為數(shù)據(jù)挖掘領(lǐng)域研究的重要課題之一。由于個(gè)人數(shù)據(jù)極容易被商業(yè)用途的應(yīng)用收集與分析,所以越來越多的數(shù)據(jù)擁有者不愿意提供個(gè)人信息,除非個(gè)人信息中的敏感信息的隱私能得到保障。保護(hù)個(gè)人隱私信息最直接的方法是將能唯一標(biāo)識(shí)一個(gè)人的屬性信息(Identifier)隱藏,如姓名和身份證號(hào)碼。但這種方法無法解決另一種隱私威脅問題,即鏈接攻擊[1]。
鏈接攻擊是指用戶通過對(duì)發(fā)布的數(shù)據(jù)和其他渠道獲得的數(shù)據(jù)進(jìn)行鏈接處理,推演出隱私數(shù)據(jù),從而造成隱私泄露。文獻(xiàn)[1]提出的K-匿名數(shù)據(jù)模型正是為了解決鏈接攻擊問題。為了實(shí)現(xiàn)數(shù)據(jù)集的K-匿名化,最有代表性的一類算法[2-4]是通過用戶定義的概念層次結(jié)構(gòu)實(shí)現(xiàn)K-匿名化,都屬于單維的劃分方法,其質(zhì)量取決于使用的概念層次結(jié)構(gòu)。文獻(xiàn)[5-6]提出了目前唯一的一個(gè)多維K-匿名劃分方法,即Median Mondrian算法。實(shí)驗(yàn)結(jié)果表明該近似的貪心算法能有效地實(shí)現(xiàn)數(shù)據(jù)集的K-匿名化。
K-匿名化后的數(shù)據(jù)以數(shù)值范圍替代原始數(shù)據(jù)的精確值,并且至少有K個(gè)數(shù)據(jù)具有相同的表示,即數(shù)據(jù)的K-匿名化以損失數(shù)據(jù)的精確度實(shí)現(xiàn)數(shù)據(jù)的隱私保護(hù)。數(shù)據(jù)的精確度和數(shù)據(jù)的隱私安全性是相互矛盾的,現(xiàn)有的算法很難在上述兩個(gè)指標(biāo)上獲得平衡。理想的數(shù)據(jù)K-匿名化結(jié)果應(yīng)該是在盡可能地減少數(shù)據(jù)信息損失的情況下,實(shí)現(xiàn)數(shù)據(jù)的隱私安全的最大化。如果兩組數(shù)據(jù)分布具有相同數(shù)值范圍但數(shù)據(jù)分布不同,那么數(shù)據(jù)分布離散程度高的數(shù)據(jù)安全性高于數(shù)據(jù)分布相對(duì)集中的數(shù)據(jù)。Median Mondrian算法的設(shè)計(jì)是在簡(jiǎn)單滿足K-匿名模型要求的前提下,追求數(shù)據(jù)劃分精度的最大化,而在數(shù)據(jù)隱私安全性方面考慮不夠。
熵是最能反映數(shù)據(jù)點(diǎn)多樣性和不確定性的度量機(jī)制,因此,基于熵的概念,本文提出一種多維K-匿名劃分方法,并針對(duì)數(shù)據(jù)隱私安全性提出新的K-匿名劃分結(jié)果評(píng)價(jià)標(biāo)準(zhǔn)。
1 K-匿名模型中的基本概念
K-匿名模型相關(guān)概念的定義如下:已知數(shù)據(jù)集屬于一個(gè)更大的數(shù)據(jù)分布12n,擁有屬性集12為數(shù)據(jù)記錄的第i個(gè)屬性,為數(shù)據(jù)記錄t屬性[tA的值。
定義 1 標(biāo)識(shí)符(Identifier)。數(shù)據(jù)集T的標(biāo)識(shí)符I是指能唯一標(biāo)識(shí)數(shù)據(jù)記錄的屬性。

下載該資料的人也在下載 下載該資料的人還在閱讀
更多 >

評(píng)論

查看更多

下載排行

本周

  1. 1電子電路原理第七版PDF電子教材免費(fèi)下載
  2. 0.00 MB  |  1490次下載  |  免費(fèi)
  3. 2單片機(jī)典型實(shí)例介紹
  4. 18.19 MB  |  93次下載  |  1 積分
  5. 3S7-200PLC編程實(shí)例詳細(xì)資料
  6. 1.17 MB  |  27次下載  |  1 積分
  7. 4筆記本電腦主板的元件識(shí)別和講解說明
  8. 4.28 MB  |  18次下載  |  4 積分
  9. 5開關(guān)電源原理及各功能電路詳解
  10. 0.38 MB  |  11次下載  |  免費(fèi)
  11. 6100W短波放大電路圖
  12. 0.05 MB  |  4次下載  |  3 積分
  13. 7基于AT89C2051/4051單片機(jī)編程器的實(shí)驗(yàn)
  14. 0.11 MB  |  4次下載  |  免費(fèi)
  15. 8基于單片機(jī)的紅外風(fēng)扇遙控
  16. 0.23 MB  |  3次下載  |  免費(fèi)

本月

  1. 1OrCAD10.5下載OrCAD10.5中文版軟件
  2. 0.00 MB  |  234313次下載  |  免費(fèi)
  3. 2PADS 9.0 2009最新版 -下載
  4. 0.00 MB  |  66304次下載  |  免費(fèi)
  5. 3protel99下載protel99軟件下載(中文版)
  6. 0.00 MB  |  51209次下載  |  免費(fèi)
  7. 4LabView 8.0 專業(yè)版下載 (3CD完整版)
  8. 0.00 MB  |  51043次下載  |  免費(fèi)
  9. 5555集成電路應(yīng)用800例(新編版)
  10. 0.00 MB  |  33562次下載  |  免費(fèi)
  11. 6接口電路圖大全
  12. 未知  |  30320次下載  |  免費(fèi)
  13. 7Multisim 10下載Multisim 10 中文版
  14. 0.00 MB  |  28588次下載  |  免費(fèi)
  15. 8開關(guān)電源設(shè)計(jì)實(shí)例指南
  16. 未知  |  21539次下載  |  免費(fèi)

總榜

  1. 1matlab軟件下載入口
  2. 未知  |  935053次下載  |  免費(fèi)
  3. 2protel99se軟件下載(可英文版轉(zhuǎn)中文版)
  4. 78.1 MB  |  537791次下載  |  免費(fèi)
  5. 3MATLAB 7.1 下載 (含軟件介紹)
  6. 未知  |  420026次下載  |  免費(fèi)
  7. 4OrCAD10.5下載OrCAD10.5中文版軟件
  8. 0.00 MB  |  234313次下載  |  免費(fèi)
  9. 5Altium DXP2002下載入口
  10. 未知  |  233046次下載  |  免費(fèi)
  11. 6電路仿真軟件multisim 10.0免費(fèi)下載
  12. 340992  |  191183次下載  |  免費(fèi)
  13. 7十天學(xué)會(huì)AVR單片機(jī)與C語言視頻教程 下載
  14. 158M  |  183277次下載  |  免費(fèi)
  15. 8proe5.0野火版下載(中文版免費(fèi)下載)
  16. 未知  |  138039次下載  |  免費(fèi)