0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

對ai3種不同的智商類型提出對應(yīng)的測試方法和數(shù)學(xué)公式

mK5P_AItists ? 2017-12-21 09:31 ? 次閱讀

前言:本文是未來智能實驗室關(guān)于人工智能智商的最新研究文章,主要提出智能系統(tǒng)的智能水平會因為測試目的的不同,產(chǎn)生三種不同的智商類型,針對這三種AI智商,本文也提出對應(yīng)的測試方法和數(shù)學(xué)公式。

我們在研究中發(fā)現(xiàn),人類在討論AI的智能發(fā)展水平時,需求和目的并不相同,由此在評估AI智商時也會出現(xiàn)差異,第一個目的和需求是評判當(dāng)前的AI系統(tǒng)(或機器人)是否在智力上超越人類 ,第二個需求和目的是了解一個智能產(chǎn)品在服務(wù)人類時,究竟有多么聰明,和要付出多少價格。根據(jù)這一關(guān)鍵區(qū)別,未來智能實驗室提出AI系統(tǒng)應(yīng)該存在三種智商,分別是通用智商、服務(wù)智商和價值智商。

0.背景

伴隨著2016年AlphaGo戰(zhàn)勝人類圍棋冠軍李世石,世界范圍人工智能迅猛發(fā)展,人工智能威脅論也因此廣泛傳播,同時智能產(chǎn)品蓬勃發(fā)展,不斷涌現(xiàn)。人工智能究竟能不能超越人類?這些智能產(chǎn)品的智能究竟達到什么水平?回答這些問題都需要用定量的方法測試智能系統(tǒng)的發(fā)展水平。

從1950年圖靈測試提出以來,科學(xué)家已經(jīng)為人工智能發(fā)展的評價體系做了很多工作。1950年,圖靈提出了著名的圖靈實驗,采用提問和人類裁判的方法,判斷一臺計算機是否具有同人相當(dāng)?shù)闹橇?。作為最被廣泛應(yīng)用的人工智能測試方法,但圖靈測試并不檢驗Ai的智能發(fā)展水平,只是判斷智能系統(tǒng)能否與人類智能相同,而且受人為因素干擾太多,嚴重依賴于裁判者和被測試者的主觀判斷,因此往往有人在沒有得到嚴格驗證的情況下宣稱其程序通過圖靈測試,

2015年3月24日“美國科學(xué)院院刊(PNAS)發(fā)表一篇論文,提出一種新的圖靈測試方法“Visual Turing test” ,這種測試方法用來對計算機的圖像認知能力進行更為深入的評估。

2014年美國佐治亞技術(shù)學(xué)院的瑞德教授(Mark O. Riedl)認為,智能的本質(zhì)在于創(chuàng)造力。他設(shè)計了一個叫做Lovelace 2.0 版本的測試。Lovelace 2.0 的測試范圍包括:創(chuàng)作有虛擬故事的小說、詩歌創(chuàng)作、油畫和音樂等。

在解決人工智能定量測試的問題上,包括圖靈測試在內(nèi)的各種方案還存在兩個問題:第一,這些測試方法沒有形成統(tǒng)一的智能模型,并以此為基礎(chǔ)進行分析,區(qū)分智能的多個分類。導(dǎo)致無法將不同的智能系統(tǒng)包括人類進行統(tǒng)一的測試;第二是這些測試方法無法定量分析人工智能,或者只定量分析智能的某個方面,但這個系統(tǒng)究竟達到人類智慧的百分之多少,發(fā)展速度與人類智慧發(fā)展速度比率如何,這些問題在上述研究中沒有涉及。

針對這些問題,研究團隊提出:根據(jù)評測目的的不同,智能系統(tǒng)的智能水平評估存在三種智商,分別是:智能系統(tǒng)的通用智商,服務(wù)智商和價值智商。這三種智商的理論基礎(chǔ),詳細定義和評測方法將在以下內(nèi)容中做詳細闡述。

1.理論基礎(chǔ):標準智能系統(tǒng)和擴展的馮諾依曼架構(gòu)

對智能系統(tǒng)包括人類和人工智能系統(tǒng)的智力能力進行評測面臨兩個重要挑戰(zhàn):第一,人工智能系統(tǒng)目前沒有形成統(tǒng)一的模型;第二,人工智能系統(tǒng)與以人類為代表的生命體之間的比較目前沒有統(tǒng)一的模型。

針對這一問題,2014年 ,中科院虛擬經(jīng)濟與數(shù)據(jù)科學(xué)研究中心同時也是未來智能實驗室研究團隊成員,劉鋒,石勇,劉穎參考馮·諾伊曼結(jié)構(gòu)、戴維·韋克斯勒人類智力模型、知識管理領(lǐng)域DIKW模型體系等。提出“標準智能模型”,統(tǒng)一描述人工智能系統(tǒng)和人類的特征和屬性,將任何一個智能體視為一個具有“知識的獲取,掌握,創(chuàng)新和反饋”的系統(tǒng)。

對ai3種不同的智商類型提出對應(yīng)的測試方法和數(shù)學(xué)公式

基于這個模型與馮諾依曼架構(gòu)結(jié)合,可以形成擴展的馮諾依曼架構(gòu),相比馮諾依曼架構(gòu),這個模型增加了創(chuàng)新創(chuàng)造功能,即能夠根據(jù)已有的知識,發(fā)現(xiàn)新的知識元素和新的規(guī)律,使之進入到存儲器,供計算機和控制器使用,并通過輸入/輸出系統(tǒng)與外部進行知識交互。第二個增加的是能夠進行知識共享的外部知識庫或云存儲器,而馮·諾伊曼架構(gòu)的外部存儲只為單一系統(tǒng)服務(wù)。擴展的馮諾依曼架構(gòu)在構(gòu)建AI的智商中將起到重要的作用。

對ai3種不同的智商類型提出對應(yīng)的測試方法和數(shù)學(xué)公式

2.智能系統(tǒng)三種不同智商的定義

2.1 AI通用智商的提出

基于標準智能模型,研究團隊建立AI智商測試量表,分別與2014年和2016年對包括谷歌、Siri、百度、Bing等50多個人工智能系統(tǒng)和6歲,12歲和18歲人群進行AI智商測試。從測試結(jié)果看,谷歌、百度等人工智能系統(tǒng)的性能比兩年前已有大幅提高,但仍與6歲兒童有一定差距.

對ai3種不同的智商類型提出對應(yīng)的測試方法和數(shù)學(xué)公式

應(yīng)該說上述AI智商測試是為了解決AI能否超越人類智能這個問題而開展的,這個研究是將每一個智能系統(tǒng)包括機器人,AI軟件系統(tǒng),人類,動物和其他生物當(dāng)做平等的智能體,觀察其與自然界,其他智能體在交互中顯示出來的智能水平。

對ai3種不同的智商類型提出對應(yīng)的測試方法和數(shù)學(xué)公式

AI通用智商的定義如下:基于標準智能模型,為了解決“評價各智能系統(tǒng)發(fā)展水平高低”的問題,將各智能系統(tǒng)視為平等的智能體,通過統(tǒng)一的AI智商測試量表形成的智能評測分數(shù),可以稱為AI系統(tǒng)的通用智商 Artificial intelligence General intelligence quotient (AI G IQ)。

2.2. AI服務(wù)智商的提出

在實踐中,我們發(fā)現(xiàn)除了少數(shù)AI系統(tǒng)的產(chǎn)生是出于科學(xué)實驗?zāi)康模粸槿祟愄峁┹o助性服務(wù),其他大多數(shù)AI系統(tǒng)是為了更好的服務(wù)于人類而被制造出來,它的智能也主要體現(xiàn)在為人類服務(wù)的過程中,智能水平越高,也就能更好的為人類提供服務(wù)。

對ai3種不同的智商類型提出對應(yīng)的測試方法和數(shù)學(xué)公式

這種情況下,如果用AI的通用智商標準進行評測,就明顯與產(chǎn)品的最初被制造出來的目的有重大差異。這就需要我們根據(jù)此類AI系統(tǒng)的特點,基于標準智能模型,選擇與服務(wù)相關(guān)的指標進行評測,

這些指標與AI的通用智商評測指標有相關(guān)性,但又有比較大的差異。包括對人工智能的法律,倫理道德等約束條件也應(yīng)該放在智能系統(tǒng)服務(wù)智商中。而不用放在智能系統(tǒng)的通用智商中。

AI服務(wù)智商的定義:基于標準智能模型,為了回答“智能系統(tǒng)如何才是更好的服務(wù)于人類”的問題,對智能產(chǎn)品在服務(wù)過程中體現(xiàn)的智能水平進行測試,并形成的智能評測分數(shù),可以稱為AI系統(tǒng)的服務(wù)智商,Artificial intelligence seveice intelligence quotient (AI S IQ)。

2.3.AI價值智商提出

為人類提供服務(wù)或支撐性工作的AI系統(tǒng),往往會由不同的公司和企業(yè)提供相應(yīng)的智能產(chǎn)品,例如智能音箱就有亞馬遜、百度等品牌,智能聊天機器人包括科大訊飛、蘋果Siri等,由于是由不同企業(yè)生產(chǎn)制造,完成相同或相近功能,每個企業(yè)的造價或售價也會不同,服務(wù)智商與成本或價格關(guān)聯(lián)會對消費者購買智能產(chǎn)品產(chǎn)生重要的影響。

對ai3種不同的智商類型提出對應(yīng)的測試方法和數(shù)學(xué)公式

AI價值智商的定義:基于標準智能模型,為了幫助使用者判斷需要用多大經(jīng)濟代價獲得智能系統(tǒng)的智力能力, 將智能系統(tǒng)的服務(wù)智商除以該系統(tǒng)的出售價格,形成的智能評測分數(shù),可以稱為AI系統(tǒng)的價值智商,Artificial intelligence Value intelligence quotient (AI V IQ)。

3.智能系統(tǒng)通用智商和服務(wù)智商的測試量表設(shè)計。

3.1.智能系統(tǒng)通用智商的測試量表

為了解決AI能否超越人類智慧的問題,2014年開始,本文研究者根據(jù)標準智能模型把智能分為“知識的獲取,掌握,創(chuàng)新和反饋”四類能力,在這四類之下又分成15個小分類能力,從更多維度評測AI,人類的智能。這15個小分類是:圖像、文字、聲音的識別和輸出,常識、計算、翻譯、排列,創(chuàng)作、挑選、猜測、發(fā)現(xiàn)等能力,每個小分類有不同的權(quán)重。

2017年,根據(jù)人工智能的發(fā)展和對智能的最新研究。研究團隊將AI通用智商評測量表從測試分類和分類權(quán)重進行調(diào)整,主要調(diào)整的內(nèi)容增加了:1.識別動態(tài)圖像的能力,2.情緒的識別與表達能力,3.識別敵我的能力,4.偽裝真實意圖的能力,5.實現(xiàn)移動定位的能力,6.實現(xiàn)改造世界的能力。除此之外對常識和創(chuàng)作的測試也做了更為細化的工作。

對ai3種不同的智商類型提出對應(yīng)的測試方法和數(shù)學(xué)公式

令智能系統(tǒng)的通用智商為IQAIG,F(xiàn)Gi是二級評價指標項得分,WGi是二級評價指標項的權(quán)重,N是評價指標項的個數(shù)。因此智能系統(tǒng)的通用智商公式如下:

3.2.智能系統(tǒng)的服務(wù)智商測試量表

目前存在大量智能系統(tǒng),例如聊天機器人,智能化的搜索引擎,智能音箱,智能手機,智能汽車,智能洗衣機,智能冰箱等,它們大部分是作為商品服務(wù)于人類的某一需求,這些智能系統(tǒng)可以稱為智能產(chǎn)品。

在標準智能系統(tǒng)和擴展的馮諾依曼架構(gòu)下,提煉他們共同的智能特征,并根據(jù)不同的服務(wù)需求,形成如下智能系統(tǒng)服務(wù)智商的測試量表。在這個服務(wù)智商的測試量表中主要突出了以下幾個方面.

1.感知周圍智能系統(tǒng)和使用者身份的能力

2.與互聯(lián)網(wǎng)云端交互的能力

3.將自身內(nèi)部狀況實時顯示給使用者,出現(xiàn)故障給予支持的能力

4.按符合當(dāng)?shù)胤珊蛡惱淼赖路?wù)人類的能力

5.危險情況下保護使用者和其他人的能力

6.自身能源使用和自動補充的能力

對ai3種不同的智商類型提出對應(yīng)的測試方法和數(shù)學(xué)公式

智能系統(tǒng)的服務(wù)智商為IQAIS,F(xiàn)Si是二級評價指標項得分,WSi是二級評價指標項的權(quán)重,N是評價指標項的個數(shù)。因此智能系統(tǒng)的服務(wù)智商公式如下:

作為一個智能產(chǎn)品服務(wù)智商的標準量表,為了盡量全面的覆蓋不同種類的智能產(chǎn)品,在設(shè)計智能產(chǎn)品服務(wù)智商測試量表時,在測試量表中從知識的獲取,掌握,創(chuàng)新和反饋四個方面為同智能產(chǎn)品留下接口

  1. 在知識的獲取分類中增加了”其他”信息輸入方式,用來評估智能產(chǎn)品在知識輸入方面的新方式。

  2. 在知識的掌握中,增加了“專業(yè)常識”,用來評估不同領(lǐng)域智能產(chǎn)品的專業(yè)方面技能,

  3. 在知識的輸出能力中,增加其他輸出能力,用來評估智能產(chǎn)品在知識輸出方面的新方式。

3.3 AI價值智商的形成方法

根據(jù)智能系統(tǒng)AI價值智商(AIVIQ)的定義,如果該智能系統(tǒng)通過出售變?yōu)楫a(chǎn)品服務(wù)于人類,令智能系統(tǒng)的服務(wù)智商為AISIQ,該智能產(chǎn)品的公開售價為P,形成智能系統(tǒng)價值智商的公式如下:

IQAIV=(IQAIS/p)*100

4.總結(jié)

通過AI三種智商認為,智能系統(tǒng)根據(jù)不同的使用和評測目標,可以有三種不同的智能水平評測方法和由此得出的三種智商:AI通用智商,AI服務(wù)智商和AI的價值智商,其中AI的通用智商已在2014年以來的論文中進行深入研究,也通過AI系統(tǒng)和人類的共同評測,分析了谷歌,SiRi,百度等與人類通用智商的差異。

本文新提出的AI服務(wù)智商和AI的價值智商為評測智能產(chǎn)品的智能水平提供了理論分析和實現(xiàn)方法。后續(xù)工作將基于AI服務(wù)智商量表,面向具體的智能產(chǎn)品,如智能音箱,智能手機,智能汽車,智能洗衣機,智能電冰箱等,開展他們的AI通用智商、服務(wù)智商和AI價值智商的評測工作。

未來智能實驗室是人工智能學(xué)家與科學(xué)院相關(guān)機構(gòu)聯(lián)合成立的人工智能,互聯(lián)網(wǎng)和腦科學(xué)交叉研究機構(gòu)。由互聯(lián)網(wǎng)進化論作者,計算機博士劉鋒與中國科學(xué)院虛擬經(jīng)濟與數(shù)據(jù)科學(xué)研究中心石勇、劉穎教授創(chuàng)建。

未來智能實驗室的主要工作包括:建立AI智能系統(tǒng)智商評測體系,開展世界人工智能智商評測;開展互聯(lián)網(wǎng)(城市)云腦研究計劃,構(gòu)建互聯(lián)網(wǎng)(城市)云腦技術(shù)和企業(yè)圖譜,為提升企業(yè),行業(yè)與城市的智能水平服務(wù)。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    29815

    瀏覽量

    268110
  • 人工智能
    +關(guān)注

    關(guān)注

    1789

    文章

    46663

    瀏覽量

    237099

原文標題:如何測量智能產(chǎn)品的AI智商水平,論AI的三種智商 |未來研究

文章出處:【微信號:AItists,微信公眾號:人工智能學(xué)家】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    高中數(shù)學(xué)公式大全

    高中數(shù)學(xué)公式大全1. 元素與集合的關(guān)系2.德摩根公式 3.包含關(guān)系4.容斥原理5.集合 的子集個數(shù)共有  個;真子集有 –1個;非空子集有  –1個;非空的真子集
    發(fā)表于 01-25 08:53

    讓你在不看任何數(shù)學(xué)公式的情況下理解傅里葉分析

    錯過這篇文章,可能你這輩子不懂什么叫傅里葉變換了這篇文章的核心思想就是:要讓讀者在不看任何數(shù)學(xué)公式的情況下理解傅里葉分析。
    發(fā)表于 09-27 12:40

    FOC有哪些數(shù)學(xué)公式

    在學(xué)習(xí)FOC控制前,我對于FOC控制完全不懂,只知道中文叫做磁場定向控制,因公司產(chǎn)品開發(fā)需要用到對永磁同步電機(PMSM)進行精確的位置控制,才開始從網(wǎng)上了解什么是FOC,有哪些數(shù)學(xué)公式,控制的過程是怎么樣的,但由于公司沒有人知道這一塊的知識,所以只能一個人慢慢找...
    發(fā)表于 08-27 07:53

    高等數(shù)學(xué)公式大全

    高等數(shù)學(xué)公式大全有大學(xué)高數(shù)公式大全、高等數(shù)學(xué)公式大全、高等數(shù)學(xué)公式大全、高等數(shù)學(xué)積分公式大全和高
    發(fā)表于 07-01 08:58 ?0次下載
    高等<b class='flag-5'>數(shù)學(xué)公式</b>大全

    數(shù)學(xué)公式編輯器 V3.1

    電子發(fā)燒友網(wǎng)站提供《數(shù)學(xué)公式編輯器 V3.1.EXE》資料免費下載
    發(fā)表于 08-15 19:11 ?47次下載

    高等數(shù)學(xué)公式大全

    高等數(shù)學(xué)公式大全,包括常用的函數(shù)公式,定理,以及一些微積分公式
    發(fā)表于 01-06 11:19 ?0次下載

    數(shù)學(xué)公式編輯器

    數(shù)學(xué)公式編輯器
    發(fā)表于 01-05 17:46 ?4次下載

    數(shù)學(xué)公式幫助自動駕駛司機規(guī)避風(fēng)險

    麻省理工學(xué)院計算機與人工智能實驗室和Delft大學(xué)認知機器人實驗室聚集在一起,創(chuàng)建了一個數(shù)學(xué)公式,可以幫助自動駕駛司機留意不可預(yù)測的危險。
    的頭像 發(fā)表于 12-10 14:40 ?2777次閱讀

    MathType7.4數(shù)學(xué)公式編輯器應(yīng)用程序免費下載

    MathType數(shù)學(xué)公式編輯器是一個強大的數(shù)學(xué)公式編輯器,能與常見的文字處理軟件和演示程序配合使用,能夠在各種文檔中加入復(fù)雜的數(shù)學(xué)公式和符號,幫助用戶快速建立專業(yè)化的數(shù)學(xué)技術(shù)文檔。
    發(fā)表于 12-11 17:49 ?19次下載

    數(shù)學(xué)公式:可幫助5G網(wǎng)絡(luò)有效共享通信頻率

    美國國家標準技術(shù)研究院(NIST)的研究人員已經(jīng)開發(fā)出一種數(shù)學(xué)公式,計算機仿真表明,該公式可以幫助5G和其他無線網(wǎng)絡(luò)選擇和共享通信頻率,其效率比試錯法高大約5000倍。
    的頭像 發(fā)表于 06-28 16:05 ?3183次閱讀

    數(shù)學(xué)公式和電磁理論分析PCB產(chǎn)品的特性和原理

    傳統(tǒng)上,EMC一直被視為黑色魔術(shù)(black magic)。其實,EMC是可以藉由數(shù)學(xué)公式米理解的。不過,縱使有數(shù)學(xué)分析方法可以利用,但那些數(shù)學(xué)方程式對實際的EMC電路設(shè)計而言,仍然太
    發(fā)表于 07-09 10:29 ?0次下載
    由<b class='flag-5'>數(shù)學(xué)公式</b>和電磁理論分析PCB產(chǎn)品的特性和原理

    特性阻抗的數(shù)學(xué)公式和各種參數(shù)詳細概述

    的介紹里,總是成片的數(shù)學(xué)公式和各種參數(shù),以及幾句聊勝于無的文字介紹,實在令人沮喪。于是本文,我們嘗試用一更為直觀的方式來做一下闡釋。首先我們要明確,在今天的RF /微波系統(tǒng)中使用50歐姆或者75歐姆是人為的選擇。其實比如說像
    發(fā)表于 10-23 10:41 ?3次下載
    特性阻抗的<b class='flag-5'>數(shù)學(xué)公式</b>和各種參數(shù)詳細概述

    基于Transformer與覆蓋注意力機制建模的手寫數(shù)學(xué)公式識別

    手寫數(shù)學(xué)公式識別是將包含數(shù)學(xué)表達式的圖像轉(zhuǎn)換為結(jié)構(gòu)表達式,例如LaTeX數(shù)學(xué)表達式或符號布局樹的過程。手寫數(shù)學(xué)表達式的識別已經(jīng)帶來了許多下游應(yīng)用,如在線教育、自動評分和
    的頭像 發(fā)表于 11-01 15:26 ?1620次閱讀

    如何在Arduino UNO上實現(xiàn)數(shù)學(xué)公式

    電子發(fā)燒友網(wǎng)站提供《如何在Arduino UNO上實現(xiàn)數(shù)學(xué)公式.zip》資料免費下載
    發(fā)表于 06-13 09:42 ?0次下載
    如何在Arduino UNO上實現(xiàn)<b class='flag-5'>數(shù)學(xué)公式</b>

    高斯如何得到他理論的結(jié)果?聊聊高斯概率分布的數(shù)學(xué)公式

    這個模擬世界中的各種物理過程都表現(xiàn)出一定程度的隨機性,例如,請想想噪聲。高斯概率分布(Gaussian probability distributions)描述了許多噪聲過程,我們應(yīng)該看看它的數(shù)學(xué)公式。
    的頭像 發(fā)表于 07-17 10:21 ?934次閱讀
    高斯如何得到他理論的結(jié)果?聊聊高斯概率分布的<b class='flag-5'>數(shù)學(xué)公式</b>