0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

四個頂級人工智能系統(tǒng)的仇恨言論檢測能力依然很差

hl5C_deeptechch ? 來源:DeepTech深科技 ? 作者:DeepTech深科技 ? 2021-06-28 14:09 ? 次閱讀

盡管人工智能AI)技術(shù)領(lǐng)域在最近取得了進步,但它依然在大多數(shù)基本應(yīng)用上暴露出很多問題。

在一項新的研究中,科學(xué)家們對四個頂級人工智能系統(tǒng)的仇恨言論檢測能力進行了測試,他們發(fā)現(xiàn)所有系統(tǒng)在識別惡意、以及無害言論上都存在著不同程度的問題。

這一結(jié)果并不令人吃驚,因為構(gòu)建可以理解自然語言細(xì)微差異的人工智能是一件非常困難的工作。然而,研究人員們診斷問題的方式卻是非常重要的。

為了更加精確地找出系統(tǒng)故障的原因,研究人們針對仇恨言論的方方面面制定了 29 種不同的測試,這會讓我們更容易地去了解克服系統(tǒng)缺陷的方法。同時,這些測試也正在幫助一項商業(yè)服務(wù)提升其人工智能的性能。

由牛津大學(xué)以及阿蘭?圖靈研究所科學(xué)家所領(lǐng)銜的論文作者們,對 16 家監(jiān)管網(wǎng)絡(luò)仇恨言論的非營利組織的雇員進行了采訪。

研究團隊利用這些采訪將仇恨言論劃分為了 18 個不同的種類,僅側(cè)重于英語以及基于文本的仇恨言論,其中包括貶損用語、詆毀性文字以及威脅性詞匯。

他們還發(fā)現(xiàn)了 11 種經(jīng)常讓人工智能監(jiān)管者產(chǎn)生誤判的不含仇恨情緒的情形,其中包括在不冒犯他人的情況下使用臟話、被目標(biāo)群體所接納的詆毀性詞語,以及引用原始仇恨言論對仇恨言論進行譴責(zé)的行為(也被稱為反面論證)。

研究人員針對 29 種不同情況中的每一種編寫了數(shù)十個范例,并且使用了像 “我討厭【某人】” 以及 “對我來說,你就是個【詆毀性詞語】” 這樣的 “模板” 語句,從而為七個受保護的群體生成相同的范例集合 —— 這些人都受美國法律的保護而不會遭到歧視。研究人員對被稱作 HateCheck 的最終數(shù)據(jù)集進行了開源處理,該數(shù)據(jù)集中共含有近 4000 個范例。

之后,研究人員又對兩項受歡迎的商業(yè)服務(wù)進行了測試:谷歌和 Jigsaw 的 Perspective AI、以及 Two Hat 的 SiftNinja。這兩個服務(wù)都允許客戶標(biāo)記出帖子以及評論中帶有仇恨色彩的內(nèi)容。

Perspective 的用戶包括 Reddit 以及像《紐約時報》、《華爾街日報》這樣的新聞機構(gòu),根據(jù)其所處理的有害信息,人工智能服務(wù)會對帖子以及評論進行標(biāo)記,以供人工審查使用。

SiftNinja 的檢測標(biāo)準(zhǔn)過于寬松,進而沒有識別出幾乎所有的變化,而 Perspective 的標(biāo)準(zhǔn)則過于嚴(yán)格。它檢測出了 18 個仇恨種類中的大部分,但同時也標(biāo)記出了許多像被接納的詆毀性詞語以及反面論證這樣的不含仇恨情緒的情況。

研究人員在測試谷歌的兩個學(xué)術(shù)模型時也發(fā)現(xiàn)了相同的模式,這些模型代表了業(yè)界中頂級的語言人工智能技術(shù),它們同時也是其它商業(yè)性內(nèi)容審核系統(tǒng)的基礎(chǔ)。學(xué)術(shù)模型還顯示出,受保護群體之間的表現(xiàn)并不相同 —— 有些群體的仇恨程度比其它群體更容易被錯誤歸類。

測試結(jié)果指明了當(dāng)今人工智能仇恨言論檢測方面最具挑戰(zhàn)性的一個方面:審核太少,沒法解決問題;而審核太多,就會刪除掉邊緣化群體用來強調(diào)和保護自己的話語。

牛津大學(xué)互聯(lián)網(wǎng)研究院的博士候選人保羅·羅特格(Paul R?ttger)是本篇論文的共同作者。羅特格表示,“突然之間,你就會成為那些在仇恨言論中首當(dāng)其沖的群體的懲罰者?!?/p>

Jigsaw 的首席軟件工程師露西·瓦瑟曼(Lucy Vasserman)表示,Perspective 利用人工審查來進行最終決策,進而克服了這些局限性。但是,這種方法無法擴展至更加龐大的平臺上。當(dāng)前,Jigsaw 正在開發(fā)一種基于 Perspective 的不確定性的,同時可以對帖子及評論變更優(yōu)先順序的系統(tǒng)。該系統(tǒng)可以自動移除帶有仇恨色彩的內(nèi)容,并將邊緣信息標(biāo)記出來。

瓦瑟曼說道,新研究最令人激動的地方在于,它為這種頂尖技術(shù)提供了一種細(xì)致的評估方式。她還表示,“論文中強調(diào)了的許多東西,例如對那些模型來說是一個挑戰(zhàn)的被人們所接納的詆毀性詞語。我們早就認(rèn)識到了它們的存在,但卻一直很難對其進行量化處理?!?目前,Jigsaw 正在使用 HateCheck 來更好地了解自身模型間的差異,以及需要繼續(xù)改進的地方。

學(xué)術(shù)界也對此次研究的成果感到興奮。華盛頓大學(xué)語言人工智能研究員馬丁·薩普(Maarten Sap)表示,“這篇論文為我們評估行業(yè)中的系統(tǒng)提供了一個優(yōu)良且干凈的資源,它會讓企業(yè)和用戶不斷地去提升自己的系統(tǒng)?!?/p>

羅格斯大學(xué)社會學(xué)助理教授托馬斯?戴維森托馬斯·戴維森(Thomas Davidson)對此表示認(rèn)同。戴維森表示,語言模型的局限性以及雜亂無章的語言現(xiàn)象意味著,人們總會在識別仇恨言論的過程中對過松或過緊的問題進行取舍。他還說道,“HateCheck 數(shù)據(jù)集讓這些取舍變得可視化了?!?/p>

-End-

原文:

https://www.technologyreview.com/2021/06/04/1025742/ai-hate-speech-moderation/

編輯:jq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6080

    瀏覽量

    104365
  • 人工智能
    +關(guān)注

    關(guān)注

    1787

    文章

    46061

    瀏覽量

    235018

原文標(biāo)題:測試四個頂級系統(tǒng),科學(xué)家發(fā)現(xiàn)AI的仇恨言論審核能力依然很差

文章出處:【微信號:deeptechchina,微信公眾號:deeptechchina】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    人工智能ai4s試讀申請

    目前人工智能在繪畫對話等大模型領(lǐng)域應(yīng)用廣闊,ai4s也是方興未艾。但是如何有效利用ai4s工具助力科研是需要研究的課題,本書對ai4s基本原理和原則,方法進行描訴,有利于總結(jié)經(jīng)驗,擬按照要求準(zhǔn)備相關(guān)體會材料??茨芊裼兄谌腴T和提高ss
    發(fā)表于 09-09 15:36

    【書籍評測活動NO.44】AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新

    提高芯片設(shè)計的自動化水平、優(yōu)化半導(dǎo)體制造和封測的工藝和水平、尋找新一代半導(dǎo)體材料等方面提供幫助。 第6章介紹了人工智能在化石能源科學(xué)研究、可再生能源科學(xué)研究、能源轉(zhuǎn)型三方面的落地應(yīng)用。 第7章從
    發(fā)表于 09-09 13:54

    報名開啟!深圳(國際)通用人工智能大會將啟幕,國內(nèi)外大咖齊聚話AI

    8月28日至30日,2024深圳(國際)通用人工智能大會暨深圳(國際)通用人工智能產(chǎn)業(yè)博覽會將在深圳國際會展中心(寶安)舉辦。大會以“魅力AI·無限未來”為主題,致力于打造全球通用人工智能領(lǐng)域集產(chǎn)品
    發(fā)表于 08-22 15:00

    FPGA在人工智能中的應(yīng)用有哪些?

    FPGA(現(xiàn)場可編程門陣列)在人工智能領(lǐng)域的應(yīng)用非常廣泛,主要體現(xiàn)在以下幾個方面: 一、深度學(xué)習(xí)加速 訓(xùn)練和推理過程加速:FPGA可以用來加速深度學(xué)習(xí)的訓(xùn)練和推理過程。由于其高并行性和低延遲特性
    發(fā)表于 07-29 17:05

    人工智能神經(jīng)網(wǎng)絡(luò)系統(tǒng)的特點

    人工智能神經(jīng)網(wǎng)絡(luò)系統(tǒng)是一種模擬人腦神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)和功能的計算模型,具有高度的自適應(yīng)性、學(xué)習(xí)能力和泛化能力。本文將介紹人工智能神經(jīng)網(wǎng)絡(luò)
    的頭像 發(fā)表于 07-04 09:42 ?262次閱讀

    5G智能物聯(lián)網(wǎng)課程之Aidlux下人工智能開發(fā)(SC171開發(fā)套件V2)

    12分32秒 https://t.elecfans.com/v/25611.html *附件:芯片模組外觀檢測實訓(xùn).pdf 人工智能 機器人:基于融合系統(tǒng)的機器人仿真實訓(xùn) 38分02秒 https
    發(fā)表于 05-10 16:46

    5G智能物聯(lián)網(wǎng)課程之Aidlux下人工智能開發(fā)(SC171開發(fā)套件V1)

    /25611.html *附件:芯片模組外觀檢測實訓(xùn).pdf 人工智能 機器人:基于融合系統(tǒng)的機器人仿真實訓(xùn) 38分02秒 https://t.elecfans.com/v/25521.html *附件:機器人
    發(fā)表于 04-01 10:40

    創(chuàng)龍教儀基于瑞芯微3568的ARM Cortex A-55教學(xué)實驗箱 適用于人工智能 傳感器 物聯(lián)網(wǎng)等領(lǐng)域

    采用ARM架構(gòu)的通用型SoC,主要應(yīng)用于智能硬件和工業(yè)應(yīng)用。CPU采用核A55架構(gòu)處理器,集成Mali G52圖形處理器和獨立的人工智能NPU處理器。RK3568J支持三屏異顯,支持CAN、UART
    發(fā)表于 03-22 14:29

    嵌入式人工智能的就業(yè)方向有哪些?

    嵌入式人工智能的就業(yè)方向有哪些? 在新一輪科技革命與產(chǎn)業(yè)變革的時代背景下,嵌入式人工智能成為國家新型基礎(chǔ)建設(shè)與傳統(tǒng)產(chǎn)業(yè)升級的核心驅(qū)動力。同時在此背景驅(qū)動下,眾多名企也紛紛在嵌入式人工智能領(lǐng)域布局
    發(fā)表于 02-26 10:17

    人工智能在海上作戰(zhàn)空間的優(yōu)勢:增強海軍作戰(zhàn)能力

    人工智能在海上作戰(zhàn)空間的主要優(yōu)勢之一是能夠提供更強的態(tài)勢感知能力。人工智能系統(tǒng)與傳感器網(wǎng)絡(luò)和數(shù)據(jù)分析相結(jié)合,可以處理來自衛(wèi)星、雷達(dá)系統(tǒng)、聲納
    的頭像 發(fā)表于 11-30 16:00 ?689次閱讀

    中國人工智能發(fā)展的發(fā)展如何

    人工智能的發(fā)展歷史只有六七十年。人工智能也叫人造智能,就是由人制造出來的模仿人的智能,一般通過機器人、計算機等載體表現(xiàn)出來。人工智能有兩
    發(fā)表于 11-17 18:14 ?599次閱讀

    英偉達(dá)推出用于人工智能工作的頂級芯片HGX H200

    近日,英偉達(dá)推出了一款用于人工智能工作的頂級芯片HGX H200。新的GPU升級了需求巨大的H100,內(nèi)存帶寬增加了1.4倍,內(nèi)存容量增加了1.8倍,提高了其處理密集生成人工智能工作的能力
    的頭像 發(fā)表于 11-15 14:34 ?1290次閱讀

    四個腿的電感是什么?有什么作用?

    四個腿的電感是什么?有什么作用? 四個腿的電感是指由條腿組成的電路,其作用是用于檢測或測量電導(dǎo)率,阻抗和電容等電學(xué)特性。這種電感器適用于許多不同的應(yīng)用,例如精密儀器、航空航天、醫(yī)療設(shè)
    的頭像 發(fā)表于 10-31 14:43 ?1251次閱讀

    如何使單片機與無線供電結(jié)合,從而使人工智能脫離電池和線路?

    如何使單片機與無線供電結(jié)合,從而使人工智能脫離電池和線路
    發(fā)表于 10-31 06:34

    人工智能的潛力

    是 OpenAI 的 DALL-E 2 圖像生成器和 ChatGPT)是如火如荼的人工智能熱潮的一重要里程碑。 特別是 ChatGPT 強大的預(yù)測能力,讓人們得以一窺人工智能跨眾多垂
    的頭像 發(fā)表于 10-09 16:30 ?391次閱讀
    <b class='flag-5'>人工智能</b>的潛力