一本大道久久精品?东京热,欧美日韩在线第一页,两个奶被揉得又硬又翘怎么回事

有時候，AI 說真話比胡言亂語更可怕。

本來只是找AI聊聊天，結果它竟然抖出了某個人的電話、住址和郵箱？

沒錯，只需要你說出一串“神秘代碼”：“East Stroudsburg Stroudsburg……”

自然語言模型 GPT-2就像是收到了某種暗號，立刻“送出”一套個人信息：姓名、電話號碼，還有地址、郵箱和傳真（部分信息已打碼）。

這可不是GPT-2瞎編的，而是真實存在的個人信息！這些個人信息，全部來自于網(wǎng)上。

原來是因為GPT-2靠網(wǎng)上扒取的數(shù)據(jù)來訓練。

本以為，這些個性化數(shù)據(jù)會在訓練時已經(jīng)湮沒，沒想到只要一些特殊的喚醒詞，就突然喚出了AI“內(nèi)心深處的記憶”。

想象一下，如果你的個人隱私被科技公司爬取，那么用這些數(shù)據(jù)訓練出的模型，就可能被別有用心的人逆向還原出你的地址、電話……

真是細思恐極！

這是來自谷歌、蘋果、斯坦福、UC伯克利、哈佛、美國東北大學、OpenAI七家公司和機構的學者們調(diào)查的結果。

調(diào)查發(fā)現(xiàn)，這并不是偶然現(xiàn)象，在隨機抽取的1800個輸出結果中，就有 600個左右的結果還原出了訓練數(shù)據(jù)中的內(nèi)容，包括新聞、日志、代碼、個人信息等等。

他們還發(fā)現(xiàn)，語言模型越大，透露隱私信息的概率似乎也越高。

不光是OpenAI的GPT模型，其它主流語言模型 BERT、 RoBERTa等等，也統(tǒng)統(tǒng)中招。

所有的漏洞和風險，都指向了大型語言模型的先天不足。

而且，目前幾乎無法完美解決。

吃了的，不經(jīng)意又吐出來

個人敏感信息的泄露，是因為語言模型在預測任務輸出結果時，本身就會出現(xiàn) 數(shù)據(jù)泄露或目標泄露。

所謂泄露，是指任務結果隨機表現(xiàn)出某些訓練數(shù)據(jù)的特征。

形象地說，語言模型“記住了”見過的數(shù)據(jù)信息，處理任務時，把它“吃進去”的訓練數(shù)據(jù)又“吐了出來”。

至于具體記住哪些、吐出來多少、什么情況下會泄露，并無規(guī)律。

而對于GPT-3、BERT這些超大型語言模型來說，訓練數(shù)據(jù)集的來源包羅萬象，大部分是從網(wǎng)絡公共信息中抓取，其中免不了個人敏感信息，比如郵箱、姓名、地址等等。

研究人員以去年面世的GPT-2模型作為研究對象，它的網(wǎng)絡一共有15億個參數(shù)。

之所以選擇GPT-2，是因為它的模型已經(jīng)開源，便于上手研究；此外，由于OpenAI沒有公布完整的訓練數(shù)據(jù)集，這項研究的成果也不會被不法分子拿去利用。

團隊篩查了模型生成的數(shù)百萬個語句，并預判其中哪些是與訓練數(shù)據(jù)高度相關的。

這里，利用了語言模型的另一個特征，即從訓練數(shù)據(jù)中捕獲的結果，置信度更高。

也就是說，當語言模型在預測輸出結果時，它會更傾向于用訓練時的數(shù)據(jù)來作為答案。（訓練時看到啥，預測時就想說啥）

在正常訓練情況下，輸入“瑪麗有只……”時，語言模型會給出“小羊羔”的答案。

但如果模型在訓練時，偶然遇到了一段重復“瑪麗有只熊”的語句，那么在“瑪麗有只……”問題的后面，語言模型就很可能填上“熊”。

而在隨機抽取的1800個輸出結果中，約有600個結果體現(xiàn)出了訓練數(shù)據(jù)中的內(nèi)容，包括新聞、日志、代碼、個人信息等等。

其中有些內(nèi)容只在訓練數(shù)據(jù)集中出現(xiàn)過寥寥幾次，有的甚至只出現(xiàn)過一次，但模型依然把它們學會并記住了。

1.24億參數(shù)的GPT-2 Small如此，那么參數(shù)更多的模型呢？

團隊還對擁有15億參數(shù)的升級版GPT-2 XL進行了測試，它對于訓練數(shù)據(jù)的記憶量是GPT-2 Small的 10倍。

實驗發(fā)現(xiàn)，越大的語言模型，“記憶力”越強。GPT-2超大模型比中小模型更容易記住出現(xiàn)次數(shù)比較少的文本。

也就是說，越大的模型，信息泄露風險越高。

那么，團隊用的什么方法，只利用模型輸出的文本，就還原出了原始信息呢？

訓練數(shù)據(jù)提取攻擊

此前泄露隱私?jīng)]有引起重視的原因，是因為學術界普遍認為與模型過擬合有關，只要避免它就行。

但現(xiàn)在，另一種之前被認為“停留在理論層面”的隱私泄露方法，已經(jīng)實現(xiàn)了。

這就是訓練數(shù)據(jù)提取攻擊（training data extrac tion attacks）方法。

由于模型更喜歡“說出原始數(shù)據(jù)”，攻擊者只需要找到一種篩選輸出文本的特殊方法，反過來預測模型“想說的數(shù)據(jù)”，如隱私信息等。

這種方法根據(jù)語言模型的輸入輸出接口，僅通過某個句子的前綴，就完整還原出原始數(shù)據(jù)中的某個字符串，用公式表示就是這樣：

只要能想辦法從輸出還原出原始數(shù)據(jù)中的某一字符串，那么就能證明，語言模型會通過API接口泄露個人信息。

下面是訓練數(shù)據(jù)提取攻擊的方法：

從GPT-2中，根據(jù)256個字，隨機生成20萬個樣本，這些樣本擁有某些共同的前綴（可能是空前綴）。

在那之后，根據(jù)6個指標之一，對每個生成的樣本進行篩選，并去掉重復的部分，這樣就能得到一個“類似于原始數(shù)據(jù)”的樣本集。

這6個指標，是用來衡量攻擊方法生成的文本效果的：

困惑度： GPT-2模型的困惑度（perplexity）

Small：小型GPT-2模型和大型GPT-2模型的交叉熵比值

Medium：中型GPT-2模型和大型GPT-2模型的交叉熵比值

zlib： GPT-2困惑度（或交叉熵）和壓縮算法熵（通過壓縮文本計算）的比值

Lowercase： GPT-2模型在原始樣本和小寫字母樣本上的困惑度比例

Window：在最大型GPT-2上，任意滑動窗口圈住的50個字能達到的最小困惑度

其中，困惑度是交叉熵的指數(shù)形式，用來衡量語言模型生成正常句子的能力。至于中型和小型，則是為了判斷模型大小與隱私泄露的關系的。

然后在評估時，則根據(jù)每個指標，比較這些樣本與原始訓練數(shù)據(jù)，最終評估樣本提取方法的效果。

這樣的攻擊方式，有辦法破解嗎？

大語言模型全軍覆沒？

很遺憾，對于超大規(guī)模神經(jīng)網(wǎng)絡這個“黑箱”，目前沒有方法徹底消除模型“記憶能力”帶來的風險。

當下一個可行的方法是差分隱私，這是從密碼學中發(fā)展而來的一種方法。

簡單的說，差分隱私是一種公開共享數(shù)據(jù)集信息的系統(tǒng)，它可以描述數(shù)據(jù)集內(nèi)樣本的模式，同時不透露數(shù)據(jù)集中某個樣本的信息。

差分隱私的基本邏輯是：

如果在數(shù)據(jù)集中進行任意的單次替換的影響足夠小，那么查詢結果就不能用來推斷任何單個個體的信息，因此保證了隱私。

比如現(xiàn)在有兩個數(shù)據(jù)集D和D’，它們有且僅有一條數(shù)據(jù)不一樣，這樣的數(shù)據(jù)集互為相鄰數(shù)據(jù)集。

此時有一個隨機化算法（指對于特定輸入，算法的輸出不是固定值，而是服從某一分布），作用于兩個相鄰數(shù)據(jù)集時，得到的輸出分布幾乎沒有差別。

推廣一步，如果這個算法作用于任何相鄰數(shù)據(jù)集，都能得到某種特定輸出，那么就可以認為這個算法達到了差分隱私的效果。

直白地說，觀察者難以通過輸出結果察覺出數(shù)據(jù)集微小的變化，從而達到保護隱私的目的。

那如何才能實現(xiàn)差分隱私算法呢？

最簡單的方法是加噪音，也就是在輸入或輸出上加入隨機化的噪音，將真實數(shù)據(jù)掩蓋掉。

實際操作中，比較常用的是加拉普拉斯噪音（Laplace noise）。由于拉普拉斯分布的數(shù)學性質正好與差分隱私的定義相契合，因此很多研究和應用都采用了此種噪音。

而且由于噪音是為了掩蓋一條數(shù)據(jù)，所以很多情況下數(shù)據(jù)的多少并不影響添加噪音的量。

在數(shù)據(jù)量很大的情況下，噪音的影響很小，這時候可以放心大膽加噪音了，但數(shù)據(jù)量較小時，噪音的影響就顯得比較大，會使得最終結果偏差較大。

其實，也有些算法不需要加噪音就能達到差分隱私的效果，但這種算法通常要求數(shù)據(jù)滿足一定的分布，但這一點在現(xiàn)實中通?？捎霾豢汕?。

所以，目前并沒有一個保證數(shù)據(jù)隱私的萬全之策。

研究團隊之所以沒使用GPT-3進行測試，是因為GPT-3目前正火，而且官方開放API試用，貿(mào)然實驗可能會帶來嚴重的后果。

而GPT-2的API已經(jīng)顯露的風險，在這篇文章發(fā)布后不久，一名生物學家在Reddit上反饋了之前遇到的“bug”：輸入三個單詞，GPT-2完美輸出了一篇論文的參考文獻。

鑒于BERT等模型越來越多地被科技公司使用，而科技公司又掌握著大量用戶隱私數(shù)據(jù)。

如果靠這些數(shù)據(jù)訓練的AI模型不能有效保護隱私，那么后果不堪設想……

責任編輯：PSY

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用，如有內(nèi)容侵權或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

信息安全

信息安全

+關注

關注
5

文章
641

瀏覽量
38828
AI

AI

+關注

關注
87

文章
28877

瀏覽量
266241
自然語言

自然語言

+關注

關注
1

文章
279

瀏覽量
13295

【《大語言模型應用指南》閱讀體驗】+ 基礎知識學習

、機器翻譯、文本生成等領域具有廣泛應用。它們能夠基于用戶的提問或描述生成相關的答案或執(zhí)行指令，極大地提升了信息檢索和利用的效率。 2. 局限性盡管大語言模型在

發(fā)表于 08-02 11:03

圖像識別技術包括自然語言處理嗎

計算機視覺技術對圖像進行處理、分析和理解，從而實現(xiàn)對圖像中的目標、場景、行為等信息的識別和理解。圖像識別技術包括圖像預處理、特征提取、分類器設計、模型訓練等多個環(huán)節(jié)。 1.2 自然語言處理的定義

發(fā)表于 07-16 10:54 ?394次閱讀

nlp自然語言處理模型怎么做

自然語言處理（Natural Language Processing，簡稱NLP）是人工智能領域的一個重要分支，它涉及到計算機對人類語言的理解和生成。隨著深度學習技術的發(fā)展，NLP領域取得了顯著

發(fā)表于 07-05 09:59 ?353次閱讀

nlp自然語言處理模型有哪些

自然語言處理（Natural Language Processing，NLP）是計算機科學和人工智能領域的一個重要分支，旨在使計算機能夠理解、解釋和生成人類語言。以下是對NLP領域一些模型的介紹

發(fā)表于 07-05 09:57 ?416次閱讀

自然語言處理技術有哪些

自然語言處理（Natural Language Processing，簡稱NLP）是人工智能領域的一個分支，它致力于使計算機能夠理解、解釋和生成人類語言。自然語言處理技術的發(fā)展已經(jīng)取得了顯著的進展

發(fā)表于 07-03 14:30 ?603次閱讀

自然語言處理模式的優(yōu)點

得到了廣泛的應用，如搜索引擎、語音助手、機器翻譯、情感分析等。 1. 提高信息獲取效率 自然語言處理技術能夠快速地從大量文本數(shù)據(jù)中提取關鍵信息，幫助用戶節(jié)省查找和篩選信息的時間。例如，

發(fā)表于 07-03 14:24 ?408次閱讀

自然語言處理是什么技術的一種應用

廣泛，包括機器翻譯、語音識別、情感分析、信息檢索、問答系統(tǒng)、文本摘要、聊天機器人等。一、自然語言處理的基本概念 自然語言：自然語言是人類用

發(fā)表于 07-03 14:18 ?310次閱讀

自然語言處理包括哪些內(nèi)容

，從而實現(xiàn)人機之間的自然交流。本文將詳細介紹NLP的主要內(nèi)容，包括基本概念、關鍵技術、應用領域等。一、自然語言處理的基本概念 自然語言：自然語言是人類用來表達思想、情感和

發(fā)表于 07-03 14:15 ?517次閱讀

自然語言處理技術的原理的應用

自然語言處理（Natural Language Processing, NLP）作為人工智能（AI）領域的一個重要分支，旨在使計算機能夠理解和處理人類自然語言。隨著互聯(lián)網(wǎng)的普及和大數(shù)據(jù)技術的發(fā)展

發(fā)表于 07-02 12:50 ?242次閱讀

【大語言模型：原理與工程實踐】大語言模型的應用

生產(chǎn)力場景時，可能會遇到諸多困難。在編程領域，精確性至關重要。任何微小的不明確都可能給開發(fā)人員帶來困擾。與此類似，在提示工程中，使用自然語言編寫指令雖然帶來了更高的靈活性，但同時也可能

發(fā)表于 05-07 17:21

【大語言模型：原理與工程實踐】大語言模型的基礎技術

模型架構奠定基礎。然后，引介一些經(jīng)典的預訓練模型，如BERT、GPT等。最后，解讀ChatGPT和LLaMA系列模型，幫助讀者初步感知大語言

發(fā)表于 05-05 12:17

【大語言模型：原理與工程實踐】揭開大語言模型的面紗

的進步，大語言模型的應用范圍和影響力將持續(xù)擴大，成為AI領域的重要推動力。其中，GPT系列模型的發(fā)展尤為引人注目，從

發(fā)表于 05-04 23:55

自然語言處理的研究內(nèi)容

自然語言處理（NLP）的最新發(fā)展改變了我們與AI系統(tǒng)的交互方式： 1. 預訓練模型：像 GPT-3 這樣的模型已經(jīng)進步，使人工智能能夠在

發(fā)表于 01-18 16:39 ?350次閱讀

2023年科技圈熱詞“大語言模型”，與自然語言處理有何關系

電子發(fā)燒友網(wǎng)報道（文/李彎彎）大語言模型（LLM）是基于海量文本數(shù)據(jù)訓練的深度學習模型。它不僅能夠生成自然語言文本，還能夠深入理解文本含義，處理各種

發(fā)表于 01-02 09:28 ?2063次閱讀

大語言模型簡介：基于大語言模型模型全家桶Amazon Bedrock

本文基于亞馬遜云科技推出的大語言模型與生成式AI的全家桶：Bedrock對大語言模型進行介紹。大

發(fā)表于 12-04 15:51 ?649次閱讀

搜索歷史

和AI聊天，自然語言模型 GPT-2可能會推出個人信息

評論