0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌說(shuō)機(jī)器學(xué)習(xí)還能產(chǎn)生“偏見(jiàn)”?你有偏見(jiàn)嗎?

454398 ? 來(lái)源:網(wǎng)絡(luò)整理 ? 2018-05-14 18:20 ? 次閱讀

機(jī)器學(xué)習(xí)也會(huì)對(duì)數(shù)據(jù)產(chǎn)生偏見(jiàn),從而導(dǎo)致錯(cuò)誤的預(yù)測(cè)。我們?cè)撊绾谓鉀Q這一問(wèn)題? Google的新論文或許會(huì)揭曉答案。 機(jī)器學(xué)習(xí)中的機(jī)會(huì)均等 隨著機(jī)器學(xué)習(xí)計(jì)算穩(wěn)步發(fā)展,越來(lái)越多人開(kāi)始關(guān)注其對(duì)于社會(huì)的影響。機(jī)器學(xué)習(xí)的成功分支之一是監(jiān)督學(xué)習(xí)。有著足夠的歷史遺留

機(jī)器學(xué)習(xí)中的機(jī)會(huì)均等

隨著機(jī)器學(xué)習(xí)計(jì)算穩(wěn)步發(fā)展,越來(lái)越多人開(kāi)始關(guān)注其對(duì)于社會(huì)的影響。機(jī)器學(xué)習(xí)的成功分支之一是監(jiān)督學(xué)習(xí)。有著足夠的歷史遺留數(shù)據(jù)和計(jì)算資源,學(xué)習(xí)算法預(yù)測(cè)未來(lái)事件的效果往往令人震驚。以一個(gè)假設(shè)為例,算法可以被用來(lái)高精度預(yù)測(cè)誰(shuí)將會(huì)償還他們的貸款。貸款人可能會(huì)使用這樣的預(yù)測(cè),以幫忙決定誰(shuí)應(yīng)該首先得到貸款?;跈C(jī)器學(xué)習(xí)做出的決定,其實(shí)用性往往令人難以置信,并對(duì)我們的生活產(chǎn)生了深遠(yuǎn)的影響。

然而,最好的預(yù)測(cè)也可能出錯(cuò)。盡管機(jī)器學(xué)習(xí)致力于最小化出錯(cuò)的可能性,但我們?cè)撊绾畏乐鼓承┙M非均勻的共享這些錯(cuò)誤?考慮到一些情況下,我們擁有的數(shù)據(jù)相對(duì)較少,且其特征不同于那些與預(yù)測(cè)任務(wù)相關(guān)的大眾方法。由于預(yù)測(cè)精度一般與訓(xùn)練的數(shù)據(jù)量息息相關(guān),一些組中的錯(cuò)誤預(yù)測(cè)將會(huì)更加常見(jiàn)。例如,盡管他們償還了貸款,預(yù)測(cè)最后也可能將過(guò)多的個(gè)體標(biāo)記到“高違約風(fēng)險(xiǎn)”組中。當(dāng)組中的成員恰逢一個(gè)敏感屬性,如種族、性別、殘疾、或宗教時(shí),便會(huì)導(dǎo)致不公正的或有偏見(jiàn)的結(jié)果。

盡管需要,但機(jī)器學(xué)習(xí)中一直缺乏防止這類歧視,且基于敏感屬性的審核方法。有一種憨厚的方法是在做任何其他事之前,從數(shù)據(jù)中刪除一組敏感屬性。其想法是一種“無(wú)意識(shí)的不公平”,然而,由于存在“冗余編碼”也未能成功。即使在數(shù)據(jù)中不存在某個(gè)特定的屬性,其他屬性的組合也可以作為代理。

另一個(gè)普用方法被稱之為“統(tǒng)計(jì)平價(jià)”,其要求預(yù)測(cè)必須與敏感屬性無(wú)關(guān)。這直觀上聽(tīng)起來(lái)是可取的,但結(jié)果本身往往與敏感屬性相關(guān)。例如,男性心臟衰竭的發(fā)病率通常比女性更高。當(dāng)預(yù)測(cè)這樣的醫(yī)療情況時(shí),要阻斷預(yù)測(cè)結(jié)果和組成員之間的一切相關(guān)性,既不現(xiàn)實(shí),也不可齲

機(jī)會(huì)平等

考慮到這些概念上的困難,我們已經(jīng)提出了一種方法,用于測(cè)量和防止基于一系列敏感屬性所產(chǎn)生的歧視。我們還展示了如何調(diào)整一個(gè)給定的預(yù)測(cè),需要的話,它可以更好的權(quán)衡分類精度和非歧視。

我們想法的核心是,符合理想結(jié)果的個(gè)體,應(yīng)因此而擁有平等正確分類的機(jī)會(huì)。在我們虛構(gòu)的貸款例子中,它意味著預(yù)測(cè)“低風(fēng)險(xiǎn)”會(huì)實(shí)際償還貸款的人不應(yīng)該依賴于敏感屬性,如種族或性別。我們稱之為監(jiān)督學(xué)習(xí)中的機(jī)會(huì)均等。

實(shí)施時(shí),我們的框架還改善了激勵(lì)機(jī)制,將差預(yù)測(cè)的成本從個(gè)人轉(zhuǎn)移到?jīng)Q策者,它可以通過(guò)投資提高預(yù)測(cè)精度以進(jìn)行響應(yīng)。完美的預(yù)測(cè)總能滿足我們的概念,這表明建立更精準(zhǔn)預(yù)測(cè)的中心目標(biāo)與避免歧視的目標(biāo)一致。

為了方便你自己探索博客文章中的想法,我們的Big Picture團(tuán)隊(duì)創(chuàng)造了一個(gè)美妙的互動(dòng),以視覺(jué)化不同的概念和權(quán)衡。所以,你可以訪問(wèn)他們的主頁(yè)了解更多相關(guān)資訊。一旦你瀏覽了演示,請(qǐng)查看論文的完整版,它由得克薩斯大學(xué)奧斯汀分校的Eric Price和芝加哥TTI的Nati Srebro共同完成。今年,我們會(huì)在巴塞羅召開(kāi)的神經(jīng)信息處理系統(tǒng)(NIPS)會(huì)議上提交該論文。所以,如果你在附近的話,一定要停下腳步和我們中的一員聊聊天。

我們的論文決不是該重要且復(fù)雜話題的終點(diǎn)。它加入了一個(gè)正在進(jìn)行的多學(xué)科研究對(duì)談話。我們希望可以鼓舞未來(lái)的研究,進(jìn)一步討論可實(shí)現(xiàn)的方法,以權(quán)衡環(huán)境歧視和機(jī)器學(xué)習(xí),并開(kāi)發(fā)有助于從業(yè)者應(yīng)對(duì)這些挑戰(zhàn)的工具。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6128

    瀏覽量

    104949
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8349

    瀏覽量

    132315
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    人工智能、機(jī)器學(xué)習(xí)和深度學(xué)習(xí)存在什么區(qū)別

    人工智能指的是在某種程度上顯示出類似人類智能的設(shè)備。AI很多技術(shù),但其中一個(gè)很大的子集是機(jī)器學(xué)習(xí)——讓算法從數(shù)據(jù)中學(xué)習(xí)。
    發(fā)表于 10-24 17:22 ?2423次閱讀
    人工智能、<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>和深度<b class='flag-5'>學(xué)習(xí)</b>存在什么區(qū)別

    AI大模型的倫理與社會(huì)影響

    個(gè)人隱私得到保護(hù),防止數(shù)據(jù)泄露和濫用。 對(duì)于敏感數(shù)據(jù)的處理,如生物識(shí)別信息或健康記錄,需要遵循更嚴(yán)格的隱私和安全標(biāo)準(zhǔn)。 偏見(jiàn)與歧視 AI大模型可能會(huì)從訓(xùn)練數(shù)據(jù)中繼承偏見(jiàn),導(dǎo)致對(duì)某些群體或個(gè)體產(chǎn)生不公平的決策。 這需要在模型訓(xùn)
    的頭像 發(fā)表于 10-23 15:13 ?323次閱讀

    【「時(shí)間序列與機(jī)器學(xué)習(xí)」閱讀體驗(yàn)】+ 簡(jiǎn)單建議

    這本書(shū)以其系統(tǒng)性的框架和深入淺出的講解,為讀者繪制了一幅時(shí)間序列分析與機(jī)器學(xué)習(xí)融合應(yīng)用的宏偉藍(lán)圖。作者不僅扎實(shí)地構(gòu)建了時(shí)間序列分析的基礎(chǔ)知識(shí),更巧妙地展示了機(jī)器學(xué)習(xí)如何在這一領(lǐng)域發(fā)揮巨
    發(fā)表于 08-12 11:21

    深度學(xué)習(xí)與傳統(tǒng)機(jī)器學(xué)習(xí)的對(duì)比

    在人工智能的浪潮中,機(jī)器學(xué)習(xí)和深度學(xué)習(xí)無(wú)疑是兩大核心驅(qū)動(dòng)力。它們各自以其獨(dú)特的方式推動(dòng)著技術(shù)的進(jìn)步,為眾多領(lǐng)域帶來(lái)了革命性的變化。然而,盡管它們都屬于機(jī)器
    的頭像 發(fā)表于 07-01 11:40 ?1101次閱讀

    【大語(yǔ)言模型:原理與工程實(shí)踐】核心技術(shù)綜述

    的復(fù)雜模式和長(zhǎng)距離依賴關(guān)系。 預(yù)訓(xùn)練策略: 預(yù)訓(xùn)練是LLMs訓(xùn)練過(guò)程的第一階段,模型在大量的文本數(shù)據(jù)上學(xué)習(xí)語(yǔ)言的通用表示。常用的預(yù)訓(xùn)練任務(wù)包括遮蔽語(yǔ)言建模(Masked Language
    發(fā)表于 05-05 10:56

    機(jī)器學(xué)習(xí)8大調(diào)參技巧

    今天給大家一篇關(guān)于機(jī)器學(xué)習(xí)調(diào)參技巧的文章。超參數(shù)調(diào)優(yōu)是機(jī)器學(xué)習(xí)例程中的基本步驟之一。該方法也稱為超參數(shù)優(yōu)化,需要搜索超參數(shù)的最佳配置以實(shí)現(xiàn)最佳性能。
    的頭像 發(fā)表于 03-23 08:26 ?551次閱讀
    <b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>8大調(diào)參技巧

    通過(guò)增強(qiáng)一致性訓(xùn)練,有效緩解CoT中的偏見(jiàn)問(wèn)題

    這些偏見(jiàn)特征可能導(dǎo)致模型在沒(méi)有明確提及這些偏見(jiàn)的情況下,系統(tǒng)性地歪曲其推理過(guò)程,從而產(chǎn)生不忠實(shí)(unfaithful)的推理。
    發(fā)表于 03-22 10:37 ?306次閱讀
    通過(guò)增強(qiáng)一致性訓(xùn)練,有效緩解CoT中的<b class='flag-5'>偏見(jiàn)</b>問(wèn)題

    FPGA在深度學(xué)習(xí)應(yīng)用中或?qū)⑷〈鶪PU

    提供商外,英偉達(dá)還成立了專業(yè)的人工智能研究實(shí)驗(yàn)室。 不過(guò),機(jī)器學(xué)習(xí)軟件公司 Mipsology 的首席執(zhí)行官兼聯(lián)合創(chuàng)始人盧多維奇?拉祖爾 (Ludovic Larzul) 表示,GPU 還存在著一些缺陷
    發(fā)表于 03-21 15:19

    谷歌模型框架是什么軟件?谷歌模型框架怎么用?

    谷歌模型框架通常指的是谷歌開(kāi)發(fā)的用于機(jī)器學(xué)習(xí)和人工智能的軟件框架,其中最著名的是TensorFlow。TensorFlow是一個(gè)開(kāi)源的機(jī)器
    的頭像 發(fā)表于 03-01 16:25 ?771次閱讀

    人工智能和機(jī)器學(xué)習(xí)的頂級(jí)開(kāi)發(fā)板哪些?

    機(jī)器學(xué)習(xí)(ML)和人工智能(AI)不再局限于高端服務(wù)器或云平臺(tái)。得益于集成電路(IC)和軟件技術(shù)的新發(fā)展,在微型控制器和微型計(jì)算機(jī)上實(shí)現(xiàn)機(jī)器學(xué)習(xí)算法和深度
    的頭像 發(fā)表于 02-29 18:59 ?723次閱讀
    人工智能和<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>的頂級(jí)開(kāi)發(fā)板<b class='flag-5'>有</b>哪些?

    谷歌模型怎么用PS打開(kāi)文件和圖片

    谷歌模型本身并不是用Adobe Photoshop(簡(jiǎn)稱PS)打開(kāi)的文件和圖片格式。谷歌模型通常是用于機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的模型文件,如Ten
    的頭像 發(fā)表于 02-29 18:25 ?1335次閱讀

    谷歌模型怎么用手機(jī)打開(kāi)文件

    )、.onnx(Open Neural Network Exchange)等。這些文件通常是為機(jī)器學(xué)習(xí)或深度學(xué)習(xí)模型設(shè)計(jì)的。
    的頭像 發(fā)表于 02-29 18:17 ?1386次閱讀

    谷歌模型框架是什么?哪些功能和應(yīng)用?

    谷歌模型框架(Google Model Framework)并不是一個(gè)特定的框架,而是指谷歌開(kāi)發(fā)的一系列軟件框架,用于支持機(jī)器學(xué)習(xí)和人工智能的應(yīng)用。以下是一些與
    的頭像 發(fā)表于 02-29 18:11 ?1380次閱讀

    什么是機(jī)器學(xué)習(xí)?它的重要性體現(xiàn)在哪

    任務(wù)的解決方法。機(jī)器學(xué)習(xí)的重要性體現(xiàn)在幾個(gè)方面數(shù)據(jù)處理能力:在當(dāng)今數(shù)字化時(shí)代,我們產(chǎn)生了大量的數(shù)據(jù)。機(jī)器學(xué)習(xí)能夠處理和分析這些龐大的數(shù)據(jù)集,
    的頭像 發(fā)表于 01-05 08:27 ?1339次閱讀
    什么是<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>?它的重要性體現(xiàn)在哪

    面對(duì)未來(lái)的AI:三大挑戰(zhàn)

    人工智能系統(tǒng)需要使用數(shù)據(jù)進(jìn)行訓(xùn)練。但數(shù)據(jù)集往往是由偏見(jiàn)或不準(zhǔn)確的人制作的。因此,人工智能系統(tǒng)會(huì)使偏見(jiàn)長(zhǎng)期存在。在招聘實(shí)踐和刑事司法中尤其如此,管理這些偏見(jiàn)可能很困難。
    的頭像 發(fā)表于 11-16 10:21 ?594次閱讀