0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

DeepMind給AI測IQ,結(jié)果出人意料!

jmiy_worldofai ? 來源:未知 ? 作者:胡薇 ? 2018-07-24 16:52 ? 次閱讀

活在一個AI“泛濫”的時代,我們幾乎每天都能看到 AI 研究上的最新進展。昨天,AI 打 DoTA 戰(zhàn)勝人類了;今天,AI 能自己找路了;明天,AI 能假冒人類打電話了。在擔心 AI 會滅掉人類的人們眼中,AI 正像一只怪物一樣野蠻生長,像一只侵略軍一樣從遠方大跨步逼近。

然而實際上,你所看到的這些進展,只是不同的 AI 在特定方向的進步。雖然當前基于深度學習的 AI 熱潮已經(jīng)有五六年了,還是沒有一個獨立的 AI,像一個獨立的人一樣,能夠優(yōu)秀地執(zhí)行多種任務(wù)。

人們在形容 AI 時,通常會用這樣一種說法:這個 AI 的智商,跟三歲小孩差不多。 智商 (Intelligence quotient) 簡稱 IQ,是評價人類智商一個普遍接受的標準 。你有智商,我也有智商,就連三歲小孩也有智商。接下來問題來了:既然說 AI 跟三歲小孩差不多,那么它的智商到底有多少呢

得給 AI 測測智商了。

DeepMind要給AI測IQ

自 AlphaGo 橫空出世以來,AI 在解決一些復(fù)雜的、策略性的問題上,能力已經(jīng)得到了證明。但如果想要更像“人”,AI 必須也擁有像人類一樣的抽象理解能力。

現(xiàn)在的 AI 計算能力不用說了,推理能力也很強,所以只剩抽象理解能力了。Google 旗下的 AI 科研機構(gòu) DeepMind 認為,“基于神經(jīng)網(wǎng)絡(luò)機器學習模型取得了驚人的成績,但想要衡量其推理抽象概念的能力,卻非常困難?!?/p>

為了搞清楚現(xiàn)在的 AI 在抽象理解能力上究竟實力如何,DeepMind 還真給 AI 設(shè)計了一套測試題:

這套測試題,借鑒了人類的 IQ 測試里著名的瑞文推理測驗:給定一組圖片,找到符合其“演進”規(guī)律的圖片。

(圖片來源:DeepMind 論文)

在這種測試中,題目里并不會告訴你要找到符合什么標準的圖形,而是需要我們根據(jù)日常生活中學習或掌握到的一些基本原則,來理解和分析測試中出現(xiàn)的簡單圖案。

要找到正確的答案,往往要借鑒我們從生活中明白的“演進”規(guī)律。比如小樹苗長成大樹,比如從 0 到1、2、3、4、5 的加法,再比如加減乘除。以上這些,就是我們生活中所提煉出的抽象的“演進”(progression)的意義,就是人類的抽象理解能力。

“但是,我們現(xiàn)在還沒有找到辦法,能讓 AI 也可以從 ‘日常經(jīng)驗’中學到類似的能力?!?DeepMind 在論文中說。

“不過,我們依然可以很好地利用人類的這種視覺抽象邏輯測試,來設(shè)計一個實驗。在這個測試中,我們并不是像人類測試那樣,考察從日常生活到視覺推理問題的知識轉(zhuǎn)移。而是研究AI在將知識從一組受控的視覺推理問題,轉(zhuǎn)移到另一組問題的能力?!?/p>

簡單翻譯一下這段話就是:DeepMind 先給 AI 喂一組由三角形構(gòu)成的圖像的視覺推理題庫,等訓(xùn)練的差不多了,再出一組由方塊構(gòu)成的視覺推理題,讓 AI 去回答,看它是能隨機應(yīng)變舉一反三,還是學會了三角,換成方塊就不靈了。

機器人仍需努力

對于擔心 AI 取代人類的朋友來說,DeepMind 的一部分實驗結(jié)果確實是個好消息:一些最棒的 AI 模型,在這個IQ測試中的表現(xiàn)得并不咋樣。

正如預(yù)期的那樣,當訓(xùn)練集和測試集所采用的抽象元素相同時,多個 AI 模型都表現(xiàn)出超過75%的準確率。

然而,當測試集和訓(xùn)練集出現(xiàn)變化,甚至有時候只是把黑點換成較暗的淺色圓點,AI 的表現(xiàn)就會像無頭蒼蠅一樣,失去了準星。

(一些知名AI模型的表現(xiàn) 圖片來源:DeepMind 論文)

上面這些都是深度神經(jīng)網(wǎng)絡(luò)領(lǐng)域的當紅炸子雞,測起智商來卻沒那么靈光了。

ResNet (Deep Residual Network),即深度殘差網(wǎng)絡(luò)在其中一組測試中僅僅得到22.4%的低分。 要知道,它的提出曾被形容為CNN(卷積神經(jīng)網(wǎng)絡(luò))的一個里程碑式事件,它在網(wǎng)絡(luò)深度上比其他模型提升了n個量級,更重要的是它的殘差學習方式,改良了模型的架構(gòu),因此一出現(xiàn)就秒殺眾前輩。

測試中表現(xiàn)最好的 WReN 模型,則是 DeepMind 在關(guān)系網(wǎng)絡(luò) (Relation Networks) 模型基礎(chǔ)上改良的版本。它增加了對不同圖像組合之間關(guān)系的分析,并可以對這類 IQ 測試的各種可能性結(jié)果進行評估。

不過,DeepMind 針對這個測試的邏輯,對一些模型進行改良,改良后的模型表現(xiàn)出明顯的提升。

比如,在一些模型中,DeepMind 加入了元標記(meta-targets) 的輔助訓(xùn)練方法,讓模型對數(shù)據(jù)集背后體現(xiàn)出的形狀、屬性(形狀的數(shù)量、大小、顏色深淺等)以及關(guān)系(同時出現(xiàn)、遞減、遞增等等)進行預(yù)測,當這部分預(yù)測準確時,最終回答的準確率就明顯出現(xiàn)提升,預(yù)測錯誤時,回答準確率明顯下降。一些極端情況下,模型回答的準確率更是從預(yù)測錯誤時的32%提升至了87%。

(元標記預(yù)測準確度與最終答案準確率的關(guān)系圖)

DeepMind 表示,他們設(shè)計的這個實驗,最終目的并不是為了讓 AI 能夠通過這種 IQ 測試。他們關(guān)注的是 AI 泛化能力的問題。

泛化是指模型很好地擬合以前未見過的新數(shù)據(jù)的能力,這是機器學習界的術(shù)語,你也可以粗暴的理解成一個 AI 模型能否在各類場景中“通吃”。AI 的泛化能力越強,離啥都能干的所謂“通用人工智能”就越近。

DeepMind 在博客最后這樣說道:

研究表明,尋找關(guān)于泛化問題的普遍結(jié)論可能沒有任何意義。我們測試的神經(jīng)網(wǎng)絡(luò)在某些泛化方案中表現(xiàn)優(yōu)秀,但是其他方案下卻很糟糕。

諸如所使用模型的架構(gòu)、模型是否被訓(xùn)練從而能解釋答案背后的邏輯等一系列因素,都會對泛化效果帶來影響。而在大多數(shù)情況下,當需要處理過往經(jīng)驗從未涉及的、或完全陌生的情景時,這些 AI 的表現(xiàn)很糟糕。

至少現(xiàn)在看來,AI 還有很長的路要走啊。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    28877

    瀏覽量

    266221
  • DeepMind
    +關(guān)注

    關(guān)注

    0

    文章

    129

    瀏覽量

    10770

原文標題:DeepMind給最厲害的AI測了IQ,結(jié)果讓人輕松了不少!

文章出處:【微信號:worldofai,微信公眾號:worldofai】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    基本電子元件的內(nèi)在之美

    ),其內(nèi)部竟出人意料地令人嘆服。晶體管、發(fā)光二極管(LED)和其他半導(dǎo)體可能是最重要的部分,但電阻器、電容器和電感器的簡單物理特性也有其獨特之處。——Samuel K. Moore
    發(fā)表于 07-11 16:49

    谷歌DeepMind推出新一代藥物研發(fā)AI模型AlphaFold 3

    谷歌DeepMind公司近日重磅推出了一款名為AlphaFold 3的全新藥物研發(fā)AI模型,這一創(chuàng)新技術(shù)將為科學家們提供前所未有的幫助,使他們能更精確地理解疾病機制,進而開發(fā)出更高效的治療藥物。
    的頭像 發(fā)表于 05-10 09:35 ?312次閱讀

    希捷科技業(yè)績出人意料,四財季利潤可能超華爾街預(yù)期

    據(jù) LSEG 提供的數(shù)據(jù)顯示,希捷預(yù)計本年度六月季度的每股調(diào)整后收益為 70 美分,區(qū)間為上浮 20 美分或下調(diào) 20 美分,而市場分析師普遍預(yù)期為 60 美分。此外,該公司預(yù)計收入中位數(shù)為 18.5 億美元,與預(yù)期相符。
    的頭像 發(fā)表于 04-24 16:10 ?399次閱讀

    開發(fā)者手機 AI - 目標識別 demo

    。Native接口完成目標識別后將結(jié)果返回JS,在預(yù)覽中標識識別的物體。 Native提供了4個接口: static napi_value Init(napi_env env, napi_value
    發(fā)表于 04-11 16:14

    微軟發(fā)布AI生成解決方案,預(yù)防失控風險

    微軟公開聲明:“確保生成式 AI 免受提示詞注入攻擊已成為一項關(guān)鍵任務(wù)。這類攻擊企圖通過操縱人工智能系統(tǒng)達成其意料之外的結(jié)果,如制造不良內(nèi)容或泄露敏感數(shù)據(jù)?!?/div>
    的頭像 發(fā)表于 04-02 10:17 ?254次閱讀

    谷歌DeepMind推出SIMI通用AI智能體

    近日,谷歌的DeepMind團隊發(fā)布了其最新研究成果——SIMI(Scalable Instructable Multiworld Agent),這是一個通用人工智能智能體,能夠在多種3D虛擬環(huán)境
    的頭像 發(fā)表于 03-18 11:39 ?751次閱讀

    谷歌DeepMind推新AI模型Genie,能生成2D游戲平臺

    據(jù)報道,谷歌公司的DeepMind團隊近期發(fā)布了AI模型Genie,此模型擁有多達110億個參數(shù),能夠依據(jù)用戶提供的圖片及提示詞創(chuàng)建出相當完整的2D游戲場景。
    的頭像 發(fā)表于 02-27 14:53 ?633次閱讀

    谷歌DeepMind資深AI研究員創(chuàng)辦AI Agent創(chuàng)企

    近日,剛從谷歌DeepMind離職的資深AI研究員Ioannis Antonoglou宣布創(chuàng)辦了一家名為“AI Agent”的創(chuàng)企。Ioannis Antonoglou常駐倫敦,此前曾擔任谷歌
    的頭像 發(fā)表于 02-04 10:02 ?632次閱讀

    谷歌DeepMind科學家欲建AI初創(chuàng)公司

    據(jù)知情人士透露,谷歌人工智能部門DeepMind的兩名杰出科學家Laurent Sifre和Karl Tuyls正在與投資者商討在巴黎成立一家新的人工智能初創(chuàng)公司的事宜。
    的頭像 發(fā)表于 01-22 14:41 ?390次閱讀

    再登Nature!DeepMind大模型突破60年數(shù)學難題,解法超出人類已有認知

    用大模型解決困擾數(shù)學家60多年的問題,谷歌DeepMind最新成果再登 Nature。 作者之一、谷歌DeepMind研究副總裁Pushmeet Kohli表示: 訓(xùn)練數(shù)據(jù)中不會有這個方案,它之前
    的頭像 發(fā)表于 12-24 21:40 ?456次閱讀
    再登Nature!<b class='flag-5'>DeepMind</b>大模型突破60年數(shù)學難題,解法超<b class='flag-5'>出人</b>類已有認知

    關(guān)于工業(yè)AI應(yīng)用與人才培養(yǎng)的調(diào)研結(jié)果

    在這個結(jié)果中,有一些指向了“AI是未來方向,需預(yù)先技術(shù)儲備”,說明重視AI是一種行為,但也同時說明另一個隱藏的可能,即,并非有顯著的需求支撐,而是為了AI
    的頭像 發(fā)表于 12-05 15:58 ?474次閱讀
    關(guān)于工業(yè)<b class='flag-5'>AI</b>應(yīng)用與人才培養(yǎng)的調(diào)研<b class='flag-5'>結(jié)果</b>

    AWS和英偉達攜手推進AI,谷歌DeepMind重塑材料科學

    DeepMind在材料科學領(lǐng)域的最新發(fā)現(xiàn),即220萬種晶體結(jié)構(gòu)的識別,將如何徹底改變我們對新材料發(fā)現(xiàn)和應(yīng)用的理解。這些突破性成就不僅代表了科技的巨大進步,也為未來的產(chǎn)業(yè)發(fā)展鋪平了道路。 AWS與英偉達加強合作,推動AI技術(shù)發(fā)展 近日,亞馬遜AWS的CEO Adam Sel
    的頭像 發(fā)表于 11-30 21:50 ?455次閱讀
    AWS和英偉達攜手推進<b class='flag-5'>AI</b>,谷歌<b class='flag-5'>DeepMind</b>重塑材料科學

    谷歌DeepMind出人耳無法察覺的AI音頻水印技術(shù)SynthID

    像synthid這樣的水印工具是針對生成ai造成的特定損害的重要保護裝置。例如,美國總統(tǒng)拜登在人工智能行政命令中要求制定政府主導(dǎo)的人工智能生成內(nèi)容水印標準。雖然是很有希望的領(lǐng)域,但目前的技術(shù)與防止偽造的萬能解決對策相距甚遠。
    的頭像 發(fā)表于 11-21 11:10 ?626次閱讀

    什么是中頻采樣?什么是IQ采樣?中頻采樣和IQ采樣的比較和轉(zhuǎn)換

    什么是中頻采樣?什么是IQ采樣?中頻采樣和IQ采樣的比較和轉(zhuǎn)換? 中頻采樣和IQ采樣是數(shù)字信號處理中非常重要的概念。在數(shù)字信號處理中,模擬信號需要經(jīng)過采樣變成數(shù)字信號,這樣才能讓數(shù)字電路加以處理。而
    的頭像 發(fā)表于 10-22 11:24 ?4739次閱讀
    什么是中頻采樣?什么是<b class='flag-5'>IQ</b>采樣?中頻采樣和<b class='flag-5'>IQ</b>采樣的比較和轉(zhuǎn)換

    華為銷量超越蘋果!

    投行分析師團隊也表示,華為現(xiàn)在已經(jīng)從蘋果手中奪走中國市場老大的地位。iPhone 15賣得不如前一代好,銷量降幅甚至達到更大的兩位數(shù),尤其是在華為出人意料推出Mate 60 Pro后,其整體銷量超車蘋果。
    的頭像 發(fā)表于 10-18 16:43 ?981次閱讀