最近有一部叫做“愛死機”的劇火了。
全名叫做《愛,死亡和機器人》(Love, Death &Robots),每一集都是獨立的動畫短片,平均時長只有15分鐘,我特別喜歡其中幾集關(guān)于機器人的科幻短片。
套用這部劇的名稱,讓我們來聊一個現(xiàn)實話題:AI、隱私和機器人。
AI的燃料
AI技術(shù)與隱私保護是近年來越來越倍受關(guān)注的話題。
從來沒有哪個時代像當今一樣到處充滿了對個人隱私的侵犯,也沒有哪個時代像當今這樣對隱私看得如此之重。事實上,你的隱私將無處可藏。
數(shù)據(jù)對于AI來說,就像煤炭之于蒸汽機,電能之于燈泡,汽油之于汽車。近年來,AI這臺發(fā)動機已經(jīng)再次發(fā)動,只有源源不斷地喂給它更多的燃料,才能朝著遠方前進。這臺發(fā)動機的能耗很高,燃燒效率有時卻不高,必須要足夠多的燃料。
汽車發(fā)動機必須在動力與節(jié)能之間尋找更高的平衡點,AI也必須在應(yīng)用潛能和隱私數(shù)據(jù)保護(涉及數(shù)據(jù)的利用效率)之間尋找更適合的平衡點。
隱私的隱喻
關(guān)于隱私保護也在與時俱進,以前關(guān)注的個人隱私更多的是自身的私密性。明星在這個問題上是深受困擾的人群,整天被狗仔隊跟蹤,生怕被偷拍了不雅照片,吊詭的是,其實明星有時候更怕沒有狗仔隊跟蹤。隱私與自身利益永遠都存在著一個權(quán)衡。
隨著時代發(fā)展和進步,特別是人工智能技術(shù)的迭代演進,隱私的關(guān)注點也變得更為復(fù)雜。
AI的發(fā)展需要更多數(shù)據(jù),每個應(yīng)用APP在你第一次打開時,會給你一個巨長無比的所謂隱私保護協(xié)議,然后你看也不看就點了“接受”,當然其實看了也沒用,只是告訴你他們是匿名獲取你的隱私數(shù)據(jù),并且你的隱私數(shù)據(jù)不會被利用。
其實,這種隱私協(xié)議的潛臺詞無非就是,要么用我們的服務(wù)、默許我們收集數(shù)據(jù),要么就不要用。
天天被電話騷擾的你,有時候也許不介意多接一個騷擾電話。每逢佳節(jié),商場超市促銷時,經(jīng)常有信用卡推銷或者房產(chǎn)中介等促銷員給你一個小禮物讓你“登記”一下個人信息,填個申請表,以得到后續(xù)他們“更優(yōu)質(zhì)的服務(wù)”或者得到“VIP身份”。
這里其實更吊詭,明明是為了想要收集我們的信息,卻讓我們填“申請表”。你想了一下,反正現(xiàn)在每個人的信息都被大量的泄露了,也不差這點吧,反正他們都知道,無所謂,填吧,至少還能得到一個不錯的小禮物。實際上,你將“得到”更多。
這些商家線下獲客,有了聯(lián)系方式,后面就可以推送給你優(yōu)惠券、促銷券、代金券,發(fā)放更多小禮品,后面竟然連你什么時候需要買房、買車、買奶粉都知道了,還無微不至提供各種服務(wù),有沒有很意外,有沒有很驚喜?
也許你會問:我的隱私數(shù)據(jù)是怎么被偷走的?
其實,不是被偷走的。只要你出門,就在泄露你的隱私,你的臉,你的聲音,你的背包的顏色,都是暴露在空氣中的隱私數(shù)據(jù)。在AI算法的眼里,你就是一個行走的數(shù)據(jù)流。
你以為不出門就不會泄露數(shù)據(jù)了?隨著智能手機、智能家居、智能手環(huán)、智能音響、智能掃地機器人等這些高科技產(chǎn)品橫空出世,成為大眾娛樂的新熱點,AI應(yīng)用場景甚多,數(shù)不勝數(shù)。
你又會說:哈哈,真扯!我覺得你說的這些信息還好,我身邊的人都能看到啊,沒你說的那么隱私吧?
其實在AI時代,關(guān)于人的一切數(shù)據(jù)都是隱私。你讓身邊人知道的信息不一定愿意讓更多人知道,否則你在網(wǎng)上的網(wǎng)名怎么不用真名呢?天天帶著一張身份認證和支付用的臉出門不覺得不安全么?隱私數(shù)據(jù)關(guān)乎的是你的個體信息,因為你是獨一無二的。
那么,具體有哪些隱私數(shù)據(jù)呢?
基于你的個人身份數(shù)據(jù),比如身份證號、手機號、家庭住址、工作地點,AI算法在各個社交平臺上挖掘關(guān)聯(lián)關(guān)系,建立圖譜信息,可以掌握你的社交層面的信息,如朋友圈、親人圈、同事圈,關(guān)系強弱,等等各種社會屬性信息,構(gòu)成一個完整的個人信息畫像,這便確定了你這個獨一無二的“社會”人。
基于你的生物特征數(shù)據(jù),各種應(yīng)用APP收集的面部特征、聲音特征,智能手環(huán)收集到的心率血壓特征、作息習(xí)慣、睡眠數(shù)據(jù),健身應(yīng)用中的體重身高、身體柔韌性、體脂含量等等,可以輕松被挖掘被建模,這便構(gòu)成了人這個實體存在的多維空間信息。
上述兩類可獲得的數(shù)據(jù)只要足夠多,加上你的各種行為數(shù)據(jù),AI算法甚至可以推斷出你的人格數(shù)據(jù)(或者叫心智數(shù)據(jù))你的思維方式,你在想什么,你的喜好,你的性格,形成描述人精神層面的內(nèi)在模型。
舉個例子,一個很著名的關(guān)于人格與人性的模型叫做大五類人格特征模型,一般稱為OCEAN,這個模型包含了五類因素:開放性(Openness)、嚴謹性(Conscientiousness)、外向性(Extraversion)、宜人性(Agreeableness)、神經(jīng)質(zhì)(Neuroticism)。
機器人,另一個我
開頭說到AI、隱私和機器人科幻之間可能存在某種關(guān)聯(lián)。這種關(guān)聯(lián)源自于技術(shù)的不斷發(fā)展,科幻為技術(shù)的未來提供了某種可能性的遐想。
AI的發(fā)展需要很多數(shù)據(jù)來滿足場景建模的需要,AI算法可以通過分析每個人的各種行為數(shù)據(jù)推導(dǎo)出這個人的人格特征。算法通過個人在社交網(wǎng)站中的點贊數(shù)據(jù)即可分析出這個人的喜好特征,通過協(xié)同過濾算法就可以對個人進行精準廣告推送,比如給外向的人推送的廣告場景相對活躍和充滿激情,給內(nèi)向的人推送的則是相對安靜和私密的場景。
同樣的分析手段甚至被用在選舉宣傳的過程,能起到影響選民決策判斷的作用。通過給不同性格或者意向動搖的選民推送不同版本的選舉廣告,或者推送對手的負面新聞,左右目標群體的決策,達到“心理操縱”的目的。
而不斷進化的人臉識別的技術(shù)能僅通過面部特征的識別就能判斷出一個人的性取向這么私密的信息,準備率能達到80%以上,而我們?nèi)祟惐旧砗茈y僅通過一張臉就能判斷出一個人的性取向。以色列的一家公司Faception聲稱可以直接通過面部特征來識別恐怖分子、高智商的人群,分分鐘看透你的內(nèi)心。
AI可以不斷地從人類的隱私數(shù)據(jù)中攫取價值,甚至能夠再現(xiàn)人的心智模型。有沒有想過,有一天,一旦AI掌握了人的足夠多的關(guān)鍵數(shù)據(jù),建立更加完備的模型,不僅能做到“心理操縱”,甚至可以做到“心靈控制”。
人類的實體存在和精神存在被抽象為一個個復(fù)雜的畫像模型,或者“心靈鏡像”,這些模型和鏡像包含了我們的所有特征,身份、性格、思維等等。只要將數(shù)據(jù)拷貝到一個機器人中,就可以生成另一個“我”來,甚至另一批“我”。
這里的機器人可以理解為以機器為載體的AI算法和存儲機制,加上更為先進的能源和機器進化機制,托管人類只是理所當然的事情,人類的心靈鏡像只是被更為高階的AI算法利用。會發(fā)生什么,我現(xiàn)在還不敢往下去想。
這或許讓你想起了《黑客帝國》《異次元駭客》這樣的科幻電影?!睈鬯罊C“(Love,Death & Robots)的第一集《桑尼的優(yōu)勢(Sonnie’s Edge)》、第七集《天鷹座裂隙之外(Beyond the Aquila Rift)》和第十五集《盲點(BlindSpot)》也隱含了這樣的主題。
AI通過不斷的迭代和進化,直至讓機器人達到與人的心靈模型近乎一致,這是科學(xué)家們一直在追求的夢想,也是可怕的未知的未來。
已知的未來
AI應(yīng)用的邊界、隱私數(shù)據(jù)保護的度在哪,現(xiàn)在還是未知。社交活動數(shù)據(jù)、零售數(shù)據(jù)、金融行為數(shù)據(jù)、醫(yī)療健康數(shù)據(jù)等被廣泛用于AI各種應(yīng)用場景,的確也朝著為人類帶來更多服務(wù)的方向發(fā)展,但是對于這樣的涉及隱私數(shù)據(jù)利用的監(jiān)管仍處于探索階段。
任何企業(yè)應(yīng)用與隱私之間需要一個權(quán)衡。歐盟去年5月出臺的一般數(shù)據(jù)保護條例(GDPR)中有幾條關(guān)于隱私數(shù)據(jù)的保護原則,其中不僅包括隱私數(shù)據(jù)的處理過程需公正透明,使用場景和保留期限需明確限定,數(shù)據(jù)需保證完整、準確和保密等要求;而且還要求對隱私數(shù)據(jù)的獲取要滿足最小化原則,也即只獲取必要的、相關(guān)的、限定的隱私數(shù)據(jù)。
GDPR的推出在全球關(guān)乎隱私數(shù)據(jù)的保護方面具有非常強的引領(lǐng)作用。在各種AI算法和模型得到越來越廣泛應(yīng)用的今天,針對上述隱私數(shù)據(jù)的保護原則,尤其是最小化原則、保密性原則、透明性原則,AI公司或者與AI產(chǎn)品相關(guān)的公司必須考慮AI算法的發(fā)展方向??梢灶A(yù)見,未來滿足下面條件的算法將是主要方向:
(1)需要更少隱私數(shù)據(jù)的AI算法。這樣的算法要么可以自己生成觀測數(shù)據(jù),如生成式對抗網(wǎng)絡(luò)(GAN);要么通過分布式解決中心化訓(xùn)練對數(shù)據(jù)量的要求,如分布式機器學(xué)習(xí)(Federatedlearning)可以實現(xiàn)在邊緣設(shè)備端進行模型的再訓(xùn)練。
(2)基于加密數(shù)據(jù)的訓(xùn)練算法。將原始隱私數(shù)據(jù)加密,并且還能通過加密后的數(shù)據(jù)進行訓(xùn)練,這樣不需要減少對隱私數(shù)據(jù)的獲取,也能保證數(shù)據(jù)的保密性。這樣的算法包括差分隱私技術(shù)、同態(tài)加密以及遷移學(xué)習(xí)等方法。
(3)可解釋的AI(Explainable AI,簡稱XAI)。很多AI算法的黑箱性質(zhì)讓人類擔憂。XAI致力于提高算法應(yīng)用的透明度,構(gòu)建“玻璃箱”模型,使人類能夠輕松理解AI算法,提高AI認知智能在人類活動中的可信度。這將是未來趨勢。
評論
查看更多