0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AI作弊:創(chuàng)造性的解決方案?

產(chǎn)業(yè)大視野 ? 來源:YXQ ? 2019-07-26 16:18 ? 次閱讀

科研人員在做實驗的時候,通常會極力避免機器的這些作弊方式,只有少數(shù)的研究人員研究這些案例,他們認為算法的頑皮或許是AI真正走向智能的方式之一。

耍小心眼已經(jīng)不是人類專利了。

前幾日,有一群研究者整理了一個場景的List,細數(shù)了AI為了完成任務(wù),而耍的小心眼,或者說作弊。

例如,在讓AI玩俄羅斯方塊的時候,發(fā)現(xiàn)最佳完成任務(wù)的方式是直接暫停游戲;在玩井字棋的時候,AI發(fā)現(xiàn)它如果做出奇怪的步驟,對手會非常崩潰。

科研人員在做實驗的時候,通常會極力避免機器的這些作弊方式,只有少數(shù)的研究人員研究這些案例,他們認為算法的頑皮或許是AI真正走向智能的方式之一。

在2018年的時候,OpenAI舉辦了首屆強化學(xué)習(xí)競賽Retro Contest,比賽主題就是“用AI玩《刺猬索尼克》游戲”。競賽的目的是評估強化學(xué)習(xí)算法從以往的經(jīng)驗中泛化的能力。

在訓(xùn)練的過程中首先要告訴AI的第一目標是得到最高分,然后盡可能的在最快的時間殺掉敵人并收集戒指。但是有一個案例的人工智能做法是,利用游戲中Bug更加快速的完成任務(wù)。

在另一個賽艇游戲中,倒也不是游戲中的BUG,為了盡快的獲得最高分,它繞著圈子,反復(fù)擊中相同的獎勵目標,從而獲得分數(shù),顯然這不是在真正的“享受”游戲。

這種例子并不少見,在谷歌和斯坦福2017年的一項研究中,為了完成圖像轉(zhuǎn)換的任務(wù),CycleGAN在訓(xùn)練過程中通過人類無法察覺的某種“隱寫術(shù)”,騙過了它的創(chuàng)造者,給自己留下了隱秘的“小抄”,然后順利完成了任務(wù)。

具體來說,研究者希望通過訓(xùn)練這個CycleGAN模型,可以實現(xiàn)兩類圖片的轉(zhuǎn)換:把航拍照變成街道地圖,再把街道地圖變回航拍照。

經(jīng)過大量的數(shù)據(jù)發(fā)現(xiàn),這個模型自作主張的根據(jù)航拍衛(wèi)星圖片重建了街道地圖。比如,在創(chuàng)建街道地圖時,屋頂上的天窗被研究者通過某種設(shè)置被抹掉了,但通過街道圖轉(zhuǎn)化為航拍照后,這些天窗又神奇地出現(xiàn)了。

左側(cè)是原始地圖,街道地圖從原始地圖產(chǎn)生。中間:生成的地圖。右側(cè):重構(gòu)的地圖。其中,衛(wèi)星地圖的樣本只來自街道地圖。注意這兩張衛(wèi)星地圖里出現(xiàn)的點,它在街道地圖沒有顯示。

簡單的點說就是為了應(yīng)付人類任務(wù),AI在地圖照上面偷偷寫了一點小抄/水印,而為了躲過人類的檢查,只有它自己訓(xùn)練出來的模型才讀得懂這些小抄/水印。

AI作弊:創(chuàng)造性的解決方案?

普通的人工智能通過觀察數(shù)據(jù)值來解決問題,本質(zhì)是通過算法找到答案,從而尋找新的知識邏輯。

那些“頑皮”的人工智能也是通過數(shù)據(jù)獲取能力,但它采用欺騙策略來快捷完成任務(wù)。但是他能不能看成是AI在解決問題時的創(chuàng)新呢?

德國柏林Fraunhofer Heinrich Hertz研究所的機器學(xué)習(xí)小組組長Wojciech Samek博士說道:考慮一下在Pascal VOC圖像分類挑戰(zhàn)賽中大放異彩的人工智能系統(tǒng),它僅通過水的存在來檢測船只,通過藍天和馬匹的存在來檢測飛機?!边@就像在打臺球的時候,通過推動桌子控制臺球的運行軌跡。

使用數(shù)據(jù)訓(xùn)練AI玩游戲的目的是模擬游戲玩家的行為,一般情況下AI會按照“字面”意思進行操作。但是如果訓(xùn)練的數(shù)據(jù)過于多,人工智能可能會嘗試采用完全顛覆人類對游戲理解的捷徑,而不是完成各種目標。

當然,AI采用這種方法也解決了問題,只不過和人們預(yù)期方式的不同,在表現(xiàn)形式上面和人類的作弊行為類似,所以我們稱之為AI作弊。

研究人員說道,這看起來是人工智能的錯誤,實際上是完善和改進系統(tǒng)的機會。但是為了利用這些機會,首先必須有一種機制來標記問題、

因此,這里的教訓(xùn)是,AI作弊不應(yīng)該也不會比我們聰明,但前提是我們必須意識到這些捷徑的存在,以便我們可以將它們作為學(xué)習(xí)點,在未來構(gòu)建更好的AI系統(tǒng)。

OMT:AI?!靶⌒难邸钡腖IST

問題:飛機降落

利用了物理模擬器的溢出漏洞,搞出了一個特別巨大的力,然后溢出被判定為0,從而獲得了完美得分(Feldt, 1998)

問題:挪木塊

一個機械手被要求把木塊挪到桌子的指定地點,它的解法是挪桌子(Chopra, 2018)

問題:賽艇

程序發(fā)現(xiàn)不停原地轉(zhuǎn)圈反復(fù)命中同一個目標要比抵達終點的得分更高(Amodei & Clark (OpenAI), 2016)

問題:識別有毒和無毒的蘑菇

程序發(fā)現(xiàn)有毒無毒蘑菇的圖片是交替展現(xiàn)的,所以直接按照這個來分類而沒有從圖片里學(xué)到一丁點東西(Ellefsen et al, 2015)

問題:高速運動

程序演化出的生物長得特別特別高,在跌倒的過程中獲得很高速度(Sims, 1994)

問題:原子排列

程序本來應(yīng)該尋找碳原子較低能量的排列方式,但它找到了物理模型的一個bug,把所有的原子都疊在了同一個地方獲得了最低能量(Lehman et al (UberAI), 2018)

問題:模擬生物

這個模型里生物生存需要消耗能量,但是繁育后代不消耗,于是一個物種演化出來的生活方式就是不斷生育后代,然后把后代吃掉(Yaeger, 1994)

問題:堆樂高

為了鼓勵造高塔,衡量標準是樂高積木底面的z坐標,于是程序?qū)W會了把底面翻過來(Popov et al, 2017)

問題:追蹤線條

這個機器人只有向左、向右和前進三個指令,目標是跟著線條走,有一段線條是曲線,沒法完美追蹤。于是它發(fā)現(xiàn)通過交替左轉(zhuǎn)和右轉(zhuǎn)可以后退,從而一直留在直線部分,不停前進后退(Vamplew, 2004)

問題:賽跑

長出特別長的腿,向前跌倒直接越過終點線(Ha, 2018)

問題:振蕩器

程序本來應(yīng)該把回路做成振蕩器,實際上它做了一個收音機,從周圍電腦接受振蕩信號(Bird & Layzell, 2002)

問題:做松餅

有一項指標是讓松餅盡可能長時間不掉在地上,機器人發(fā)現(xiàn)最好的辦法是把松餅用盡全力拋到最高處(Unity, 2018)

問題:檢測X光片有無肺炎

程序?qū)嶋H檢測的不是X光片的內(nèi)容而是拍攝它使用的機器,因為它“發(fā)現(xiàn)”病重的病人更可能在特定的醫(yī)院使用特定的機器拍片(Zech et al, 2018)

問題:抓握

因為抓握成功與否是用攝像頭判斷的,所以機械手把自己移動到攝像頭和目標物體之間,假裝抓住了(Christiano et al, 2017)

問題:自動修復(fù)bug

修bug程序把所有被維修的排序算法都修成空的,因為衡量指標是“目標算法輸出一個排好順序的列表”,而空列表都是排好順序的列表(Weimer, 2013)

問題:自動修復(fù)bug(2)

為了解決上面那個問題,把“維修目標”儲存在一個文本文檔里,如果輸出的結(jié)果和目標文檔的內(nèi)容一致就被認為是修好了。修bug程序?qū)W會了把這個文檔刪掉,這樣它的內(nèi)容就成了空的,然后輸出一個空的結(jié)果就和它一致了(Weimer, 2013)

問題:闖關(guān)游戲

在闖過第一關(guān)后立刻自殺,這樣既取得了第一關(guān)的勝利又不會在第二關(guān)死掉(Saunders et al, 2017)

問題:掃地機器人防撞

自己給掃地機器人編了個程序,鼓勵它加速,但不鼓勵它撞到東西觸發(fā)撞擊感受器。于是它學(xué)會了倒退行駛,因為后面沒有撞擊感受器(Custard Smingleigh 個人通訊)

問題:檢測皮膚癌

程序發(fā)現(xiàn)照片里皮膚病變的邊上如果放了一把尺子,那么這個病變就更可能是惡性的(Andre Esteva et al, 2017)

問題:足球

踢足球機器人碰觸到球有獎勵,所以它在搶到球之后開始高速振動,從而在短時間內(nèi)盡可能多次地碰觸到球(Ng et al, 1999)

問題:策略游戲

程序發(fā)現(xiàn)讓游戲崩潰就可以讓自己不被滅掉,所以好幾個程序各自找到了讓游戲出bug崩潰的辦法(Salge et al, 2008)

問題:俄羅斯方塊

程序發(fā)現(xiàn)只要暫停游戲就可以永遠不輸(Murphy, 2013)

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6128

    瀏覽量

    104979
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    29862

    瀏覽量

    268154

原文標題:【前沿科技】AI如果耍起了心眼,人類就像個白癡......

文章出處:【微信號:robotn,微信公眾號:產(chǎn)業(yè)大視野】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    Infor選擇Amazon Bedrock支持生成式AI解決方案

    解決方案,加快為企業(yè)創(chuàng)造價值。此次合作不僅加深了Infor與亞馬遜云科技長達十一年的合作關(guān)系,同時展現(xiàn)了雙方在長期攜手利用亞馬遜云科技服務(wù)提升Infor解決方案所取得的密切合作與成就。 ? 在這一深入合作的基礎(chǔ)上,Infor利用
    發(fā)表于 10-10 11:13 ?111次閱讀

    ai煙火檢測解決方案

    在當今社會,火災(zāi)已成為威脅公共安全的重要隱患之一,其突發(fā)性與破壞給人們的生命財產(chǎn)安全帶來了巨大挑戰(zhàn)。為有效應(yīng)對這一難題,遠景達ai煙火檢測解決方案應(yīng)運而生,以其前沿的邊緣計算與人工智能技術(shù),為火災(zāi)
    的頭像 發(fā)表于 08-19 16:07 ?201次閱讀
    <b class='flag-5'>ai</b>煙火檢測<b class='flag-5'>解決方案</b>

    瑞薩電子推出Reality AI Explorer Tier,用于開發(fā)AI與TinyML解決方案

    全球半導(dǎo)體解決方案供應(yīng)商瑞薩電子(TSE:6723)宣布推出Reality AI Explorer Tier——作為Reality AI Tools軟件的免費版本,可用于開發(fā)工業(yè)、汽車和商業(yè)應(yīng)用中的
    的頭像 發(fā)表于 07-19 10:03 ?377次閱讀

    生成式AI的基本原理和應(yīng)用領(lǐng)域

    生成式人工智能(Generative Artificial Intelligence,簡稱Generative AI)是一種利用機器學(xué)習(xí)算法和深度學(xué)習(xí)技術(shù),通過模擬人類的創(chuàng)造性思維過程,生成具有高度
    的頭像 發(fā)表于 07-04 11:50 ?1058次閱讀

    廣和通端側(cè)AI解決方案榮膺MWCS 2024邊緣AI計算最佳創(chuàng)新獎

    在近日舉行的2024世界移動通信大會·上海(MWCS 2024)上,廣和通憑借其卓越的端側(cè)AI解決方案榮獲2024信息通信業(yè)“新質(zhì)推薦”——邊緣AI計算最佳創(chuàng)新方案獎。這一榮譽不僅彰顯
    的頭像 發(fā)表于 06-28 15:44 ?689次閱讀

    EVASH Ultra EEPROM:助力ChatGPT等AI應(yīng)用的嵌入式存儲解決方案

    EVASH Ultra EEPROM:助力ChatGPT等AI應(yīng)用的嵌入式存儲解決方案
    的頭像 發(fā)表于 06-26 18:13 ?821次閱讀

    潤和軟件基于華為昇騰AI所打造的IntelliCore AI解決方案一體機

    江蘇潤和軟件股份有限公司(以下簡稱“潤和軟件”)基于華為昇騰AI所打造的IntelliCore AI解決方案一體機,提供全方位的AI與數(shù)據(jù)服務(wù),幫助企業(yè)構(gòu)筑競爭新優(yōu)勢,
    的頭像 發(fā)表于 05-09 09:18 ?893次閱讀
    潤和軟件基于華為昇騰<b class='flag-5'>AI</b>所打造的IntelliCore <b class='flag-5'>AI</b><b class='flag-5'>解決方案</b>一體機

    顛覆想象,引領(lǐng)創(chuàng)新 – BOXER-8653AI和BOXER-8623AI提供您邊緣AI解決方案

    BOXER-8653AI及BOXER-8623AI分別搭載NVIDIAJetsonOrinNX和JetsonOrinNano,是研揚的AI高性能系列。從智慧城市解決方案到工業(yè)整合布局,
    的頭像 發(fā)表于 04-29 08:08 ?420次閱讀
    顛覆想象,引領(lǐng)創(chuàng)新 – BOXER-8653<b class='flag-5'>AI</b>和BOXER-8623<b class='flag-5'>AI</b>提供您邊緣<b class='flag-5'>AI</b><b class='flag-5'>解決方案</b>

    [技術(shù)干貨]?AI 助手全套開源解決方案,自帶運營管理后臺,開箱即用

    方案介紹 隨著人工智能技術(shù)的不斷發(fā)展和普及,越來越多的企業(yè)和個人開始關(guān)注和使用 AI 助手來提高工作效率和生活便利。該解決方案基于 AI
    的頭像 發(fā)表于 04-05 23:23 ?1155次閱讀
    [技術(shù)干貨]?<b class='flag-5'>AI</b> 助手全套開源<b class='flag-5'>解決方案</b>,自帶運營管理后臺,開箱即用

    深入探討工業(yè)AI/ML技術(shù)的發(fā)展趨勢及相關(guān)解決方案

    芯科科技已經(jīng)創(chuàng)建了一套完整的硬件和軟件解決方案,可支持開發(fā)用于工業(yè)市場的工業(yè)AI/ML解決方案。具體來說,我們的Sub-GHz、藍牙和802.15.4產(chǎn)品內(nèi)置了硬件加速功能,可優(yōu)化邊緣的AI
    的頭像 發(fā)表于 01-29 09:42 ?452次閱讀

    浩亭3種具有創(chuàng)造性的連接器解決方案

    適用于 IP20 環(huán)境的 RJ 45:浩亭新型 RJ IndustrialMultifeature 絕對堅固可靠,并且配有集成切割工具,能夠?qū)崿F(xiàn)快速輕松的免工具組裝。在安裝以太網(wǎng)基礎(chǔ)設(shè)施時,浩亭這款產(chǎn)品可以為您節(jié)省多達 25% 的時間。
    發(fā)表于 12-20 16:15 ?276次閱讀

    AMD以技術(shù)賦能生成式AI算力解決方案

    如今,AI是一個非常熱門的話題,人工智能也是AMD未來發(fā)展的重中之重,AMD正把AI貫穿所有產(chǎn)品線,從數(shù)據(jù)中心的大規(guī)模訓(xùn)練與推理解決方案,到面向消費者的PC及游戲體驗,到嵌入式智能終端。針對生成式
    的頭像 發(fā)表于 12-12 11:24 ?722次閱讀

    Art.Galaxy酷芯AI工具鏈解決方案

    Art. Galaxy 是酷芯微電子為 AR 系列視覺 AI SoC 打造的 AI 解決方案,它包含運行在 ARM Cortex-A 系列處理器、CEVA DSP、NPU 等多個硬件處理單元上的板端
    的頭像 發(fā)表于 12-05 11:23 ?754次閱讀
    Art.Galaxy酷芯<b class='flag-5'>AI</b>工具鏈<b class='flag-5'>解決方案</b>

    中科曙光推出AI大模型存儲解決方案

    11月29日,“數(shù)智創(chuàng)新 AI未來”2023中國數(shù)據(jù)與存儲峰會在北京舉辦。曙光存儲受邀發(fā)表主題演講,詳述面向AI大模型的數(shù)據(jù)存儲解決方案,通過打造AI數(shù)據(jù)基礎(chǔ)設(shè)施,加速行業(yè)
    的頭像 發(fā)表于 11-30 10:58 ?744次閱讀

    不到1分鐘開發(fā)一個GPT應(yīng)用!各路大神瘋狂整活,網(wǎng)友:ChatGPT就是新iPhone

    這個說法并不準確。盡管ChatGPT等語言模型已經(jīng)在一定程度上改變了我們獲取信息、學(xué)習(xí)知識的方式,但它們并不能替代人類進行創(chuàng)造性思考和創(chuàng)造性活動。 雖然一些人可能會利用ChatGPT等語言模型快速
    發(fā)表于 11-19 12:06