0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

使用聯(lián)合學(xué)習(xí)橋接金融服務(wù)中的數(shù)據(jù)孤島

星星科技指導(dǎo)員 ? 來(lái)源:NVIDIA ? 作者:Annika Brundyn ? 2022-10-10 16:34 ? 次閱讀

機(jī)器學(xué)習(xí)( ML )過(guò)程中,無(wú)法確保數(shù)據(jù)隱私,這往往阻礙了人工智能AI )在金融服務(wù)中充分發(fā)揮潛力。例如,傳統(tǒng)的 ML 方法假設(shè)所有數(shù)據(jù)都可以移動(dòng)到中央存儲(chǔ)庫(kù)。

在處理數(shù)據(jù)主權(quán)和安全考慮或個(gè)人識(shí)別信息等敏感數(shù)據(jù)時(shí),這是一個(gè)不切實(shí)際的假設(shè)。更實(shí)際地說(shuō),它忽略了數(shù)據(jù)出口挑戰(zhàn)和創(chuàng)建大型池?cái)?shù)據(jù)集的巨大成本。

對(duì)于訓(xùn)練 ML 模型有價(jià)值的大量?jī)?nèi)部數(shù)據(jù)集仍然沒(méi)有使用。金融服務(wù)行業(yè)的公司如何利用自己的數(shù)據(jù),同時(shí)確保隱私和安全?

這篇文章介紹了聯(lián)合學(xué)習(xí),并解釋了它對(duì)處理敏感數(shù)據(jù)集的企業(yè)的好處。我們介紹了在金融服務(wù)中使用聯(lián)邦學(xué)習(xí)的三種方法,并提供了關(guān)于今天開始的提示。

什么是聯(lián)合學(xué)習(xí)

聯(lián)合學(xué)習(xí)是一種 ML 技術(shù),它可以從多個(gè)孤立的數(shù)據(jù)集中提取見解,而無(wú)需共享數(shù)據(jù)或?qū)?shù)據(jù)移動(dòng)到中央存儲(chǔ)庫(kù)或服務(wù)器中。

例如,假設(shè)您有多個(gè)要用于訓(xùn)練 AI 模型的數(shù)據(jù)集。今天的標(biāo)準(zhǔn) ML 方法要求首先在一個(gè)地方收集所有訓(xùn)練數(shù)據(jù)。然而,對(duì)于世界上許多敏感的數(shù)據(jù)來(lái)說(shuō),這種方法是不可行的。這使得許多數(shù)據(jù)集和用例無(wú)法應(yīng)用人工智能技術(shù)。

另一方面,聯(lián)合學(xué)習(xí)并不假設(shè)可以創(chuàng)建一個(gè)統(tǒng)一的數(shù)據(jù)集。而是將分布式訓(xùn)練數(shù)據(jù)集留在原地。

該方法包括創(chuàng)建模型的多個(gè)版本,并將一個(gè)版本發(fā)送到數(shù)據(jù)集所在的每個(gè)服務(wù)器或設(shè)備。每個(gè)站點(diǎn)在其數(shù)據(jù)子集上本地訓(xùn)練模型,然后僅將模型參數(shù)發(fā)送回中央服務(wù)器。這是聯(lián)合學(xué)習(xí)的關(guān)鍵特性:只共享模型更新或參數(shù),而不共享訓(xùn)練數(shù)據(jù)本身。這保護(hù)了數(shù)據(jù)隱私和主權(quán)。

最后,中央服務(wù)器收集每個(gè)站點(diǎn)的所有更新,并智能地將“迷你模型”聚合為一個(gè)全局模型。該全局模型可以從整個(gè)數(shù)據(jù)集捕獲洞察,即使實(shí)際數(shù)據(jù)無(wú)法組合。

請(qǐng)注意,這些本地站點(diǎn)可以是服務(wù)器、智能手機(jī)等邊緣設(shè)備,或者任何可以在本地進(jìn)行訓(xùn)練并將模型更新發(fā)送回中央服務(wù)器的機(jī)器。

隱私保護(hù)技術(shù)的優(yōu)勢(shì)

醫(yī)療保健領(lǐng)域的大規(guī)模合作證明了多個(gè)獨(dú)立方使用聯(lián)合學(xué)習(xí)聯(lián)合訓(xùn)練人工智能模型的現(xiàn)實(shí)可行性。然而,聯(lián)合學(xué)習(xí)不僅僅是與外部合作伙伴合作。

在金融機(jī)構(gòu)中,我們看到了一個(gè)難以置信的機(jī)會(huì),可以通過(guò)聯(lián)合學(xué)習(xí)來(lái)彌合內(nèi)部數(shù)據(jù)孤島。隨著企業(yè)為新產(chǎn)品收集所有可行數(shù)據(jù),包括推薦系統(tǒng)、欺詐檢測(cè)系統(tǒng)和呼叫中心分析,全公司的投資回報(bào)率可能會(huì)增加。

然而,隱私問(wèn)題并不局限于金融數(shù)據(jù)。今天,全球范圍內(nèi)頒布的數(shù)據(jù)隱私立法浪潮(從歐洲的 GDPR 和加利福尼亞的 CCPA 開始,許多類似的法律即將出臺(tái))只會(huì)持續(xù)一段時(shí)間 加速對(duì)隱私保護(hù) ML 技術(shù)的需求 在所有行業(yè)中。

預(yù)計(jì)聯(lián)邦學(xué)習(xí)將在未來(lái)幾年成為人工智能工具集的重要組成部分。

實(shí)際業(yè)務(wù)用例

ML 算法需要數(shù)據(jù)。此外, ML 模型的實(shí)際性能不僅取決于數(shù)量除了數(shù)據(jù)之外關(guān)聯(lián)對(duì)訓(xùn)練數(shù)據(jù)進(jìn)行分類。

許多組織可以通過(guò)合并新的數(shù)據(jù)集來(lái)改進(jìn)當(dāng)前的人工智能模型,這些數(shù)據(jù)集在不犧牲隱私的情況下無(wú)法輕松訪問(wèn)。這就是聯(lián)邦學(xué)習(xí)的用武之地。

聯(lián)合學(xué)習(xí)使公司能夠利用新的數(shù)據(jù)資源,而無(wú)需數(shù)據(jù)共享。

大體上,聯(lián)邦學(xué)習(xí)支持三種類型的用例:

公司內(nèi)部:橋接內(nèi)部數(shù)據(jù)倉(cāng)庫(kù)

公司間:促進(jìn)組織間的合作

邊緣計(jì)算:跨數(shù)千臺(tái)邊緣設(shè)備學(xué)習(xí)

公司內(nèi)部用例:利用孤立的內(nèi)部數(shù)據(jù)

單個(gè)公司可能依賴多個(gè)數(shù)據(jù)存儲(chǔ)解決方案的原因有很多。例如:

數(shù)據(jù)治理規(guī)則例如 GDPR 可能需要將數(shù)據(jù)保存在特定的地理位置,并指定保留和隱私策略。

并購(gòu)來(lái)自合作伙伴公司的新數(shù)據(jù)。然而,將這些數(shù)據(jù)集成到現(xiàn)有存儲(chǔ)系統(tǒng)的艱巨任務(wù)往往會(huì)使數(shù)據(jù)長(zhǎng)期分散。

兩者都是前提 和混合云使用存儲(chǔ)解決方案,移動(dòng)大量數(shù)據(jù)的成本很高。

聯(lián)合學(xué)習(xí)使您的公司能夠跨不同業(yè)務(wù)組織、地理區(qū)域或數(shù)據(jù)倉(cāng)庫(kù)中的孤立數(shù)據(jù)集利用 ML ,同時(shí)保護(hù)隱私和安全。

poYBAGND2S6AOxkUAAFQ9d5kl48909.jpg

圖 1.公司內(nèi)部聯(lián)合學(xué)習(xí)用例的工作流。聯(lián)邦服務(wù)器存儲(chǔ)全局模型并從客戶端節(jié)點(diǎn)接收參數(shù)。

公司間用例:與外部合作伙伴協(xié)作

收集足夠的定量數(shù)據(jù)來(lái)構(gòu)建強(qiáng)大的人工智能模型對(duì)于一家公司來(lái)說(shuō)是困難的。假設(shè)一家保險(xiǎn)公司正在構(gòu)建一個(gè)有效的欺詐檢測(cè)系統(tǒng)。該公司只能從觀察到的事件中收集數(shù)據(jù),如客戶提出索賠。然而,這些數(shù)據(jù)可能無(wú)法代表整個(gè)人群,因此可能會(huì)導(dǎo)致人工智能模型偏差。

為了構(gòu)建有效的欺詐檢測(cè)系統(tǒng),該公司需要更大的數(shù)據(jù)集和更多樣化的數(shù)據(jù)點(diǎn)來(lái)訓(xùn)練穩(wěn)健、可推廣的模型。許多組織可以從與其他組織共享數(shù)據(jù)中受益。實(shí)際上,大多數(shù)組織不會(huì)在通用超級(jí)計(jì)算機(jī)或云服務(wù)器上共享其專有數(shù)據(jù)集。

pYYBAGND2S-Ae5pOAAFMSBGGaxU743.jpg

圖 2.公司間聯(lián)合學(xué)習(xí)用例的工作流。聯(lián)邦服務(wù)器存儲(chǔ)全局模型并從客戶端節(jié)點(diǎn)接收參數(shù)。

為全行業(yè)的挑戰(zhàn)提供這種合作可以帶來(lái)巨大的好處。

例如 現(xiàn)實(shí)世界中最大的聯(lián)合協(xié)作之一 ,我們看到五大洲的 20 家獨(dú)立醫(yī)院訓(xùn)練了一個(gè)人工智能模型,用于預(yù)測(cè)新冠肺炎感染患者的氧氣需求。通過(guò)參與聯(lián)邦系統(tǒng),醫(yī)院的通用性平均提高了 38% ,模型性能提高了 16% 。

同樣,在信用卡網(wǎng)絡(luò)減少欺詐活動(dòng)和銀行采取反洗錢舉措的同時(shí),維護(hù)客戶隱私也是一個(gè)真正的機(jī)會(huì)。聯(lián)合學(xué)習(xí)增加了單個(gè)銀行可用的數(shù)據(jù),這有助于解決代理銀行的洗錢活動(dòng)等問(wèn)題。

邊緣計(jì)算:智能手機(jī)和物聯(lián)網(wǎng)

谷歌 最初于 2017 年引入聯(lián)邦學(xué)習(xí),以針對(duì)分布在數(shù)十億移動(dòng)設(shè)備上的個(gè)人數(shù)據(jù)訓(xùn)練人工智能模型。 2022 年,更多的設(shè)備連接到互聯(lián)網(wǎng),包括智能手表、家庭助理、報(bào)警系統(tǒng)、恒溫器,甚至汽車。

聯(lián)邦學(xué)習(xí)對(duì)于不斷為 ML 模型收集有價(jià)值數(shù)據(jù)的各種邊緣設(shè)備都很有用,但這些數(shù)據(jù)通常對(duì)隱私敏感,數(shù)量大,或者兩者兼有,這會(huì)阻止登錄到數(shù)據(jù)中心。

聯(lián)合學(xué)習(xí)如何適應(yīng)現(xiàn)有的工作流程

需要注意的是,聯(lián)合學(xué)習(xí)是一種通用技術(shù)。聯(lián)合學(xué)習(xí)不僅僅是訓(xùn)練神經(jīng)網(wǎng)絡(luò);相反,它適用于數(shù)據(jù)分析、更傳統(tǒng)的 ML 方法或任何其他分布式工作流。

聯(lián)邦學(xué)習(xí)中很少有假設(shè),也許只有兩個(gè)值得一提: 1 )本地站點(diǎn)可以連接到中央服務(wù)器, 2 )每個(gè)站點(diǎn)都有最少的計(jì)算資源進(jìn)行本地培訓(xùn)。

除此之外,您還可以自由地使用自定義的本地和全局聚合行為設(shè)計(jì)自己的應(yīng)用程序。您可以決定對(duì)不同方的信任程度,以及與中央服務(wù)器共享的信任程度。聯(lián)邦系統(tǒng)可根據(jù)您的特定業(yè)務(wù)需求進(jìn)行配置。

例如,聯(lián)邦學(xué)習(xí)可以與其他隱私保護(hù)技術(shù)相結(jié)合,如差分隱私(增加噪聲)和同態(tài)加密(加密模型更新并模糊中央服務(wù)器看到的內(nèi)容)。

開始聯(lián)合學(xué)習(xí)

我們開發(fā)了一個(gè) 聯(lián)邦學(xué)習(xí)代碼示例 這展示了如何在對(duì)應(yīng)于兩個(gè)不同地理區(qū)域的信用卡交易數(shù)據(jù)集的兩個(gè)不同分割上訓(xùn)練全局欺詐預(yù)測(cè)模型。

關(guān)于作者

Annika Brundyn 是 NVIDIA 的解決方案架構(gòu)師。她從嵌入式系統(tǒng)計(jì)算機(jī)視覺(jué)開始工作,現(xiàn)在正在為金融服務(wù)開發(fā)聯(lián)邦學(xué)習(xí)和圖形神經(jīng)網(wǎng)絡(luò)。此前,安妮卡在紐約大學(xué)獲得了數(shù)據(jù)科學(xué)碩士學(xué)位,她在那里從事手術(shù)視頻的三維重建研究。她在開普敦大學(xué)完成了精算學(xué)和統(tǒng)計(jì)學(xué)學(xué)士學(xué)位。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 智能手機(jī)
    +關(guān)注

    關(guān)注

    66

    文章

    18331

    瀏覽量

    178729
  • 服務(wù)器
    +關(guān)注

    關(guān)注

    12

    文章

    8701

    瀏覽量

    84546
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8306

    瀏覽量

    131842
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    wds無(wú)線怎么設(shè)置

    無(wú)線分布式系統(tǒng)(Wireless Distribution System,簡(jiǎn)稱WDS)是一種允許無(wú)線網(wǎng)絡(luò)設(shè)備之間進(jìn)行的技術(shù)。通過(guò)WDS,可以將多個(gè)無(wú)線設(shè)備連接在一起,形成一個(gè)更大的無(wú)線網(wǎng)絡(luò)。這在
    的頭像 發(fā)表于 07-18 09:59 ?521次閱讀

    TSER49054KDSI轉(zhuǎn)V3link串行器數(shù)據(jù)

    電子發(fā)燒友網(wǎng)站提供《TSER49054KDSI轉(zhuǎn)V3link串行器數(shù)據(jù)表.pdf》資料免費(fèi)下載
    發(fā)表于 06-28 10:11 ?2次下載
    TSER49054KDSI轉(zhuǎn)V3link<b class='flag-5'>橋</b><b class='flag-5'>接</b>串行器<b class='flag-5'>數(shù)據(jù)</b>表

    無(wú)線和無(wú)線中繼哪個(gè)更好

    在無(wú)線通信領(lǐng)域,無(wú)線和無(wú)線中繼是兩種常見的技術(shù),用于擴(kuò)展網(wǎng)絡(luò)覆蓋范圍和增強(qiáng)信號(hào)。
    的頭像 發(fā)表于 05-22 16:41 ?4940次閱讀

    電阻應(yīng)變片不同方法有什么優(yōu)缺點(diǎn)?

    電阻應(yīng)變片的方法通常有三種基本形式:四分之一(1/4)、半(1/2)和全
    的頭像 發(fā)表于 05-16 17:14 ?2248次閱讀

    網(wǎng)絡(luò)模式是什么? 網(wǎng)絡(luò)模式和路由模式的區(qū)別

    ,以便將多個(gè)計(jì)算機(jī)連接在一起并共享資源。 網(wǎng)絡(luò)模式和路由模式的區(qū)別 網(wǎng)絡(luò)模式和路由模式是計(jì)算機(jī)網(wǎng)絡(luò)兩種不同的
    的頭像 發(fā)表于 05-10 13:48 ?3276次閱讀

    路由器路由器怎樣 路由器接好還是中繼好

    路由器和中繼是常用的網(wǎng)絡(luò)擴(kuò)展方式,用于擴(kuò)大網(wǎng)絡(luò)覆蓋范圍,提供更好的網(wǎng)絡(luò)連接。這兩種方式在不同的場(chǎng)景下有著各自的優(yōu)勢(shì),下面將詳細(xì)介紹如何路由器,以及
    的頭像 發(fā)表于 02-20 14:26 ?3363次閱讀

    為什么要無(wú)線路由器?如何通過(guò)網(wǎng)線將兩個(gè)路由器進(jìn)行?

    為什么要無(wú)線路由器?如何通過(guò)網(wǎng)線將兩個(gè)路由器進(jìn)行??jī)膳_(tái)路由器有線的兩種方法? 為什么
    的頭像 發(fā)表于 02-04 14:07 ?2063次閱讀

    小米路由器如何配置有線?

    小米路由器如何配置有線? 小米路由器作為一款智能、高性能的路由器產(chǎn)品,在無(wú)線網(wǎng)絡(luò)覆蓋方面表現(xiàn)出色,但如果你的家庭或辦公環(huán)境需要更廣闊的網(wǎng)絡(luò)覆蓋,有線便是一種理想的解決方案。本文
    的頭像 發(fā)表于 02-04 14:07 ?4417次閱讀

    路由器中繼和的區(qū)別 路由器聯(lián)的方法

    路由器中繼和的區(qū)別 路由器聯(lián)的方法 路由器中繼和的區(qū)別 路由器中繼和
    的頭像 發(fā)表于 02-03 09:49 ?5038次閱讀

    無(wú)線和mesh組網(wǎng)哪個(gè)好?

    無(wú)線和Mesh組網(wǎng)都是用于擴(kuò)展無(wú)線網(wǎng)絡(luò)覆蓋范圍的技術(shù),但它們的工作原理和應(yīng)用場(chǎng)景有所不同。 無(wú)線接通常是一對(duì)一的連接,相對(duì)較容易設(shè)置和維護(hù)。它的優(yōu)點(diǎn)在于簡(jiǎn)單性,適用于需要建立點(diǎn)對(duì)點(diǎn)連接的場(chǎng)景
    的頭像 發(fā)表于 01-19 16:12 ?5735次閱讀

    金融服務(wù)急需數(shù)據(jù)層改造

    金融服務(wù)越來(lái)越注重實(shí)時(shí)互動(dòng)體驗(yàn),重構(gòu)關(guān)鍵業(yè)務(wù)流程,從數(shù)據(jù)層入手該怎么做?文章速覽:數(shù)字化轉(zhuǎn)型正在顛覆銀行與金融業(yè)金融
    的頭像 發(fā)表于 12-23 08:04 ?716次閱讀
    <b class='flag-5'>金融</b><b class='flag-5'>服務(wù)</b>急需<b class='flag-5'>數(shù)據(jù)</b>層改造

    軟國(guó)際數(shù)據(jù)治理專業(yè)服務(wù)解決方案獲得華為云聯(lián)合基線解決方案認(rèn)證

    近日,軟國(guó)際聯(lián)合華為云生態(tài)及技術(shù)團(tuán)隊(duì)共同設(shè)計(jì)的數(shù)據(jù)治理專業(yè)服務(wù)解決方案成功通過(guò)華為云基線解決方案專家團(tuán)隊(duì)評(píng)審,軟國(guó)際
    的頭像 發(fā)表于 12-20 20:25 ?749次閱讀
    <b class='flag-5'>中</b>軟國(guó)際<b class='flag-5'>數(shù)據(jù)</b>治理專業(yè)<b class='flag-5'>服務(wù)</b>解決方案獲得華為云<b class='flag-5'>聯(lián)合</b>基線解決方案認(rèn)證

    數(shù)據(jù)臺(tái)具體是怎么解決數(shù)據(jù)孤島的?

    在數(shù)字化時(shí)代,數(shù)據(jù)已成為企業(yè)的核心資產(chǎn)。然而,由于歷史遺留問(wèn)題、部門壁壘等因素,很多企業(yè)面臨著“數(shù)據(jù)孤島”的問(wèn)題。數(shù)據(jù)孤島是指在一個(gè)組織內(nèi),
    的頭像 發(fā)表于 11-27 15:51 ?511次閱讀

    不同電源供電的器件間的

    電子發(fā)燒友網(wǎng)站提供《不同電源供電的器件間的.pdf》資料免費(fèi)下載
    發(fā)表于 11-17 09:40 ?0次下載
    不同電源供電的器件間的<b class='flag-5'>橋</b><b class='flag-5'>接</b>

    模式應(yīng)用場(chǎng)景

    1、什么是模式? Decouple an abstraction from its implementation so that the two can vary independently.
    的頭像 發(fā)表于 10-09 14:30 ?885次閱讀
    <b class='flag-5'>橋</b><b class='flag-5'>接</b>模式應(yīng)用場(chǎng)景