0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

關(guān)于AI算法能否對(duì)不同年齡、性別和膚色的人一視同仁的詳細(xì)解答

IEEE電氣電子工程師 ? 來源:賢集網(wǎng) ? 作者:電氣傳播 ? 2021-04-25 11:06 ? 次閱讀

Facebook研究人員發(fā)布了一個(gè)數(shù)據(jù)集,旨在幫助機(jī)器學(xué)習(xí)開發(fā)人員測(cè)試算法的偏差。

即使在不同的光照條件下,算法是否能夠?qū)Σ煌挲g、性別和膚色的人一視同仁呢?Facebook的AI Red團(tuán)隊(duì)近日發(fā)布了一個(gè)名為“Casual Conversations”的數(shù)據(jù)集,用于回答這個(gè)問題。10兆字節(jié)的數(shù)據(jù)由3011名參與者錄制的視頻組成;數(shù)據(jù)集由每人約15個(gè)1分鐘片段組成,總時(shí)長超過45000分鐘。視頻分別被標(biāo)記出年齡和性別,由每個(gè)參與者自我報(bào)告,膚色由訓(xùn)練有素的注解者使用標(biāo)準(zhǔn)比例確定,以及照明條件,也由注解者確定。

Facebook AI Red團(tuán)隊(duì)的研究經(jīng)理Cristian Canton給了我一個(gè)簡單的例子,說明了開發(fā)人員是如何使用數(shù)據(jù)集的。

“考慮門戶(Portal)設(shè)備,”他說。(門戶是Facebook價(jià)值150美元的桌面智能屏幕。)“我們有一個(gè)攝像頭,可以跟蹤人們。如果我現(xiàn)在是工程師來構(gòu)建這項(xiàng)技術(shù),為了確保它的包容性,我可以獲取臨時(shí)會(huì)話數(shù)據(jù)集,通過門戶中的跟蹤算法來運(yùn)行它,并測(cè)量它在哪些地方表現(xiàn)不好。比如說,你可能會(huì)發(fā)現(xiàn),對(duì)于一個(gè)特定年齡、膚色或性別的人來說,在昏暗的光線下,這是行不通的。然后我就會(huì)知道我的算法對(duì)于特定的子組有缺陷?!?/p>

Facebook的研究人員在去年的Deepfake Detection Challenge(一項(xiàng)旨在開發(fā)自動(dòng)識(shí)別欺詐媒體工具的競(jìng)賽)的前五名獲獎(jiǎng)?wù)呱砩蠝y(cè)試了該數(shù)據(jù)集。

在近日發(fā)布的一篇研究論文和博客文章中,他們報(bào)告說,雖然所有五種算法都在與較暗的膚色作斗爭(zhēng),但在年齡、性別和光照條件等方面表現(xiàn)最為一致的模型并不是第一名得主Selim Seferbekov,而是排名第三的團(tuán)隊(duì)NTechLab。有趣的是,排名第四的18歲的研究小組最擅長分析的是年齡在45歲以上的年齡組中的受試者的視頻。

在不同的人群中表現(xiàn)平平,并不是Deep Fake Challenge的評(píng)判標(biāo)準(zhǔn)之一,因?yàn)檫€沒有完整的非正式對(duì)話數(shù)據(jù)集。

Said Canton說:“如果我們今天重新開始比賽,也許我們會(huì)考慮尋找一個(gè)更具包容性的方法。”

Canton說,近日發(fā)布的Casual Conversations數(shù)據(jù)集只是創(chuàng)造人工智能公平所需工作的開始。首先,他指出,這個(gè)問題是多方面的,雖然有這樣的數(shù)據(jù)是有幫助的,但這并不是最終的解決辦法。

Image: FacebookThese pie charts show the frequency of the different tags for age, gender, apparent skin tone, and lighting conditions in the 45,186 videos that make up the Casual Conversations data set.

至于數(shù)據(jù)集開發(fā)本身,他說,該團(tuán)隊(duì)還只是在“漫長旅程的第一步”。我們已經(jīng)確定了年齡、性別、膚色和光照條件,但(這些視頻)都是在美國錄制的。如果我們?cè)谄渌麌忆浿?,我們可能?huì)發(fā)現(xiàn)更多我們需要考慮且尚未看到的多樣性?!?/p>

Canton指出,錄音的音頻部分也代表了尚未開發(fā)的潛力。這些音頻文件是通過要求受試者回答簡單的對(duì)話提示(如“你最喜歡的菜是什么”)而創(chuàng)建的,目前只針對(duì)年齡和性別進(jìn)行標(biāo)記。“我們還沒有對(duì)口音進(jìn)行注釋,但這是未來可實(shí)現(xiàn)的一個(gè)潛在途徑。我們確實(shí)認(rèn)為這篇文章可以有一些有趣的結(jié)果。不過,我們要測(cè)試音頻模型的包容性?!?/p>

Canton希望,將這些數(shù)據(jù)公之于眾將引發(fā)反饋,從而使數(shù)據(jù)集更豐富、更具包容性?!拔液芟M吹剿玫讲捎?,然后讓我的同事和學(xué)者告訴我們更多他們的想法。我們希望進(jìn)行自我批評(píng)。有了反饋,我們可以不斷改進(jìn)它。我們希望它成為衡量人工智能公平性的標(biāo)準(zhǔn)方式。”

Canton還希望這個(gè)數(shù)據(jù)集的發(fā)展能夠樹立一個(gè)新的標(biāo)準(zhǔn)。他對(duì)這個(gè)數(shù)據(jù)集的創(chuàng)建方式感到自豪,包括它是可信來源。他在我們的談話中多次強(qiáng)調(diào),3000多名受試者的付出是有報(bào)酬的,并且他們了解自己的聲音和視頻圖像是如何被使用的,如果他們改變了參與的想法,以后可以退出。

他說:“我們正試圖為負(fù)責(zé)任的人工智能在未來的樣子設(shè)定一個(gè)標(biāo)準(zhǔn),”他補(bǔ)充說,F(xiàn)acebook團(tuán)隊(duì)希望“激勵(lì)更多的人記錄擴(kuò)充數(shù)據(jù)集。重要的是要做正確的事情 -- 通過使用正確的工具?!?br /> 編輯:lyn

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • Facebook
    +關(guān)注

    關(guān)注

    3

    文章

    1429

    瀏覽量

    54610
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8353

    瀏覽量

    132315
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1200

    瀏覽量

    24621
  • AI算法
    +關(guān)注

    關(guān)注

    0

    文章

    247

    瀏覽量

    12221

原文標(biāo)題:人工智能算法對(duì)年齡、性別和膚色一視同仁嗎?

文章出處:【微信號(hào):IEEE_China,微信公眾號(hào):IEEE電氣電子工程師】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    Pure path studio內(nèi)能否自己創(chuàng)建個(gè)component,來實(shí)現(xiàn)特定的算法,例如LMS算法?

    TLV320AIC3254EVM-K評(píng)估模塊, Pure path studio軟件開發(fā)環(huán)境。 問題:1.Pure path studio 內(nèi)能否自己創(chuàng)建個(gè)component,來實(shí)現(xiàn)特定的算法
    發(fā)表于 11-01 08:25

    AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第4章-AI與生命科學(xué)讀后感

    很幸運(yùn)社區(qū)給我個(gè)閱讀此書的機(jī)會(huì),感謝平臺(tái)。 《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第4章關(guān)于AI與生命科學(xué)的部分,為我們揭示了人工智能技術(shù)在生命科學(xué)領(lǐng)域中的廣泛應(yīng)用和
    發(fā)表于 10-14 09:21

    AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第二章AI for Science的技術(shù)支撐學(xué)習(xí)心得

    非常高興本周末收到本新書,也非常感謝平臺(tái)提供閱讀機(jī)會(huì)。 這是本挺好的書,包裝精美,內(nèi)容詳實(shí),干活滿滿。 關(guān)于AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第二章“
    發(fā)表于 10-14 09:16

    HarmonyOS NEXT應(yīng)用元服務(wù)開發(fā)Accessibility(信息無障礙)介紹

    Accessibility(信息無障礙),是指任何人在任何情況下都能平等、方便地獲取信息并利用信息。其目的是縮小全社會(huì)不同階層、不同地區(qū)、不同年齡、不同健康狀況的人群在信息理解、信息交互、信息利用
    發(fā)表于 10-09 10:29

    關(guān)于UCC25640x LLC諧振控制器的常見問題解答

    電子發(fā)燒友網(wǎng)站提供《關(guān)于UCC25640x LLC諧振控制器的常見問題解答.pdf》資料免費(fèi)下載
    發(fā)表于 09-04 09:37 ?0次下載
    <b class='flag-5'>關(guān)于</b>UCC25640x LLC諧振控制器的常見問題<b class='flag-5'>解答</b>

    嵌入式軟件開發(fā)與AI整合

    嵌入式軟件開發(fā)與AI整合是當(dāng)前技術(shù)發(fā)展的重要趨勢(shì)之。隨著人工智能技術(shù)的快速發(fā)展,嵌入式系統(tǒng)越來越多地集成了AI算法,以實(shí)現(xiàn)更復(fù)雜的智能功能。以下是
    的頭像 發(fā)表于 07-31 09:25 ?634次閱讀
    嵌入式軟件開發(fā)與<b class='flag-5'>AI</b>整合

    平衡創(chuàng)新與倫理:AI時(shí)代的隱私保護(hù)和算法公平

    成了把雙刃劍,其銳利的面正逐漸指向我們的核心價(jià)值。面對(duì)這些挑戰(zhàn),制定套有效的AI治理框架和隱私保護(hù)機(jī)制變得迫在眉睫。 確保AI決策
    發(fā)表于 07-16 15:07

    ai大模型和算法有什么區(qū)別

    AI大模型和算法是人工智能領(lǐng)域的兩個(gè)重要概念,它們?cè)诤芏喾矫嬗兄芮械穆?lián)系,但同時(shí)也存在些明顯的區(qū)別。 定義和概念 AI大模型通常是指具有大量參數(shù)和復(fù)雜結(jié)構(gòu)
    的頭像 發(fā)表于 07-16 10:09 ?1408次閱讀

    中偉視界:實(shí)時(shí)監(jiān)控與預(yù)警,礦山罐籠超員AI算法如何保障礦工生命安全?

    隨著礦山智能化的發(fā)展,罐籠超員AI算法在礦山安全管理中發(fā)揮著關(guān)鍵作用。本文詳細(xì)介紹了罐籠超員AI算法的工作原理、技術(shù)實(shí)現(xiàn)和應(yīng)用效果,并展望了
    的頭像 發(fā)表于 07-12 08:54 ?275次閱讀

    傳音推進(jìn)多膚色影像技術(shù)創(chuàng)新,提供更多元的真實(shí)膚色影像成像體驗(yàn)

    本地市場(chǎng)消費(fèi)者的影像成像核心訴求,傳音研發(fā)了領(lǐng)先的多膚色影像技術(shù),這項(xiàng)技術(shù)能兼容多區(qū)域多膚色類型用戶,拍照效果受本地文化因素影響的差異化需求,最重要的是膚色成像準(zhǔn)確性及包容性,成功開啟了
    的頭像 發(fā)表于 06-19 17:17 ?388次閱讀

    求助,關(guān)于ESP32多核使用問題求解答

    關(guān)于esp32的多核使用,除了使用xTaskCreatePinnedToCore函數(shù)來控制線程跑的核心外能否有其他的實(shí)現(xiàn)比如: 現(xiàn)在有兩個(gè)bin文件,每個(gè)核心同時(shí)跑不同的bin文件,這種是否能夠?qū)崿F(xiàn)。
    發(fā)表于 06-17 06:28

    加碼多膚色影像技術(shù) 這是傳音找到的“出海利器“?

    全球化時(shí)代,市場(chǎng)競(jìng)爭(zhēng)愈演愈烈,產(chǎn)品差異化已然成為了企業(yè)脫穎而出的關(guān)鍵。在黃、白膚色長期占據(jù)人像攝影主賽道的背景下,傳音就憑借獨(dú)無二的多膚色影像技術(shù)走出非洲,走向了更廣闊的新興市場(chǎng)。 ? 聚焦深
    的頭像 發(fā)表于 06-13 16:43 ?374次閱讀

    NanoEdge AI的技術(shù)原理、應(yīng)用場(chǎng)景及優(yōu)勢(shì)

    NanoEdge AI種基于邊緣計(jì)算的人工智能技術(shù),旨在將人工智能算法應(yīng)用于物聯(lián)網(wǎng)(IoT)設(shè)備和傳感器。這種技術(shù)的核心思想是將數(shù)據(jù)處理和分析從云端轉(zhuǎn)移到設(shè)備本身,從而減少數(shù)據(jù)傳
    發(fā)表于 03-12 08:09

    各位技術(shù)大佬,請(qǐng)問下通信距離能否人為控制呢?

    請(qǐng)問各位論壇技術(shù)專家們個(gè)問題,短距離無線通信能否控制距離呢?比如設(shè)置或者做到僅在半米/米/50米.....之內(nèi)做通信的效果呢?就拿半米這個(gè)距離限定舉例,能否僅在半米內(nèi)通訊,范圍以外
    發(fā)表于 01-07 13:47

    關(guān)于400G光模塊的常見問題解答

    最近在后臺(tái)收到了很多用戶咨詢關(guān)于400G光模塊的信息,那400G光模塊作為當(dāng)下主流的光模塊類型,有哪些問題是備受關(guān)注的呢?下面來看看小易的詳細(xì)解答
    的頭像 發(fā)表于 11-16 17:07 ?719次閱讀
    <b class='flag-5'>關(guān)于</b>400G光模塊的常見問題<b class='flag-5'>解答</b>