機(jī)器學(xué)習(xí)也會(huì)對(duì)數(shù)據(jù)產(chǎn)生偏見(jiàn),從而導(dǎo)致錯(cuò)誤的預(yù)測(cè)。我們?cè)撊绾谓鉀Q這一問(wèn)題? Google的新論文或許會(huì)揭曉答案。 機(jī)器學(xué)習(xí)中的機(jī)會(huì)均等 隨著機(jī)器學(xué)習(xí)計(jì)算穩(wěn)步發(fā)展,越來(lái)越多人開(kāi)始關(guān)注其對(duì)于社會(huì)的影響。機(jī)器學(xué)習(xí)的成功分支之一是監(jiān)督學(xué)習(xí)。有著足夠的歷史遺留
機(jī)器學(xué)習(xí)中的機(jī)會(huì)均等
隨著機(jī)器學(xué)習(xí)計(jì)算穩(wěn)步發(fā)展,越來(lái)越多人開(kāi)始關(guān)注其對(duì)于社會(huì)的影響。機(jī)器學(xué)習(xí)的成功分支之一是監(jiān)督學(xué)習(xí)。有著足夠的歷史遺留數(shù)據(jù)和計(jì)算資源,學(xué)習(xí)算法預(yù)測(cè)未來(lái)事件的效果往往令人震驚。以一個(gè)假設(shè)為例,算法可以被用來(lái)高精度預(yù)測(cè)誰(shuí)將會(huì)償還他們的貸款。貸款人可能會(huì)使用這樣的預(yù)測(cè),以幫忙決定誰(shuí)應(yīng)該首先得到貸款?;跈C(jī)器學(xué)習(xí)做出的決定,其實(shí)用性往往令人難以置信,并對(duì)我們的生活產(chǎn)生了深遠(yuǎn)的影響。
然而,最好的預(yù)測(cè)也可能出錯(cuò)。盡管機(jī)器學(xué)習(xí)致力于最小化出錯(cuò)的可能性,但我們?cè)撊绾畏乐鼓承┙M非均勻的共享這些錯(cuò)誤?考慮到一些情況下,我們擁有的數(shù)據(jù)相對(duì)較少,且其特征不同于那些與預(yù)測(cè)任務(wù)相關(guān)的大眾方法。由于預(yù)測(cè)精度一般與訓(xùn)練的數(shù)據(jù)量息息相關(guān),一些組中的錯(cuò)誤預(yù)測(cè)將會(huì)更加常見(jiàn)。例如,盡管他們償還了貸款,預(yù)測(cè)最后也可能將過(guò)多的個(gè)體標(biāo)記到“高違約風(fēng)險(xiǎn)”組中。當(dāng)組中的成員恰逢一個(gè)敏感屬性,如種族、性別、殘疾、或宗教時(shí),便會(huì)導(dǎo)致不公正的或有偏見(jiàn)的結(jié)果。
盡管需要,但機(jī)器學(xué)習(xí)中一直缺乏防止這類歧視,且基于敏感屬性的審核方法。有一種憨厚的方法是在做任何其他事之前,從數(shù)據(jù)中刪除一組敏感屬性。其想法是一種“無(wú)意識(shí)的不公平”,然而,由于存在“冗余編碼”也未能成功。即使在數(shù)據(jù)中不存在某個(gè)特定的屬性,其他屬性的組合也可以作為代理。
另一個(gè)普用方法被稱之為“統(tǒng)計(jì)平價(jià)”,其要求預(yù)測(cè)必須與敏感屬性無(wú)關(guān)。這直觀上聽(tīng)起來(lái)是可取的,但結(jié)果本身往往與敏感屬性相關(guān)。例如,男性心臟衰竭的發(fā)病率通常比女性更高。當(dāng)預(yù)測(cè)這樣的醫(yī)療情況時(shí),要阻斷預(yù)測(cè)結(jié)果和組成員之間的一切相關(guān)性,既不現(xiàn)實(shí),也不可齲
機(jī)會(huì)平等
考慮到這些概念上的困難,我們已經(jīng)提出了一種方法,用于測(cè)量和防止基于一系列敏感屬性所產(chǎn)生的歧視。我們還展示了如何調(diào)整一個(gè)給定的預(yù)測(cè),需要的話,它可以更好的權(quán)衡分類精度和非歧視。
我們想法的核心是,符合理想結(jié)果的個(gè)體,應(yīng)因此而擁有平等正確分類的機(jī)會(huì)。在我們虛構(gòu)的貸款例子中,它意味著預(yù)測(cè)“低風(fēng)險(xiǎn)”會(huì)實(shí)際償還貸款的人不應(yīng)該依賴于敏感屬性,如種族或性別。我們稱之為監(jiān)督學(xué)習(xí)中的機(jī)會(huì)均等。
實(shí)施時(shí),我們的框架還改善了激勵(lì)機(jī)制,將差預(yù)測(cè)的成本從個(gè)人轉(zhuǎn)移到?jīng)Q策者,它可以通過(guò)投資提高預(yù)測(cè)精度以進(jìn)行響應(yīng)。完美的預(yù)測(cè)總能滿足我們的概念,這表明建立更精準(zhǔn)預(yù)測(cè)的中心目標(biāo)與避免歧視的目標(biāo)一致。
為了方便你自己探索博客文章中的想法,我們的Big Picture團(tuán)隊(duì)創(chuàng)造了一個(gè)美妙的互動(dòng),以視覺(jué)化不同的概念和權(quán)衡。所以,你可以訪問(wèn)他們的主頁(yè)了解更多相關(guān)資訊。一旦你瀏覽了演示,請(qǐng)查看論文的完整版,它由得克薩斯大學(xué)奧斯汀分校的Eric Price和芝加哥TTI的Nati Srebro共同完成。今年,我們會(huì)在巴塞羅召開(kāi)的神經(jīng)信息處理系統(tǒng)(NIPS)會(huì)議上提交該論文。所以,如果你在附近的話,一定要停下腳步和我們中的一員聊聊天。
我們的論文決不是該重要且復(fù)雜話題的終點(diǎn)。它加入了一個(gè)正在進(jìn)行的多學(xué)科研究對(duì)談話。我們希望可以鼓舞未來(lái)的研究,進(jìn)一步討論可實(shí)現(xiàn)的方法,以權(quán)衡環(huán)境歧視和機(jī)器學(xué)習(xí),并開(kāi)發(fā)有助于從業(yè)者應(yīng)對(duì)這些挑戰(zhàn)的工具。
-
谷歌
+關(guān)注
關(guān)注
27文章
6128瀏覽量
104949 -
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8349瀏覽量
132315
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論