0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

MIT和微軟的研究人員開(kāi)發(fā)出一種用于識(shí)別智能系統(tǒng)的新模型

nlfO_thejiangme ? 來(lái)源:lq ? 2019-02-13 13:57 ? 次閱讀

人工智能的能力我們已經(jīng)耳熟能詳,但它的弱點(diǎn)是什么、它的局限是什么才是我們需要關(guān)注的重點(diǎn)。例如,無(wú)人駕駛汽車在真實(shí)路況中會(huì)遇到很多在訓(xùn)練中從未見(jiàn)過(guò)的場(chǎng)景,如何處理這種實(shí)際與訓(xùn)練不匹配的特殊情形成為了橫在研究人員面前的一大難題。

近日,MIT和微軟的研究人員開(kāi)發(fā)出一種用于識(shí)別智能系統(tǒng)的新模型,特別是自動(dòng)駕駛系統(tǒng)在訓(xùn)練中學(xué)習(xí)到的、但是與實(shí)際情形不匹配的知識(shí)“盲點(diǎn)”,工程師們可利用這一模型識(shí)別并改進(jìn)自動(dòng)駕駛系統(tǒng)處理特殊情況的措施,提高整個(gè)系統(tǒng)的安全性。

無(wú)人駕駛汽車的人工智能系統(tǒng)在虛擬仿真環(huán)境和數(shù)據(jù)集中接受了廣泛的訓(xùn)練,以便應(yīng)對(duì)道路上可能發(fā)生的每一種狀況。但是有時(shí)候汽車在現(xiàn)實(shí)世界中會(huì)犯下意想不到的錯(cuò)誤,因?yàn)閷?duì)于有些突發(fā)事件,汽車應(yīng)該但卻沒(méi)有做出正確的應(yīng)對(duì)。

如果有一輛未經(jīng)特殊訓(xùn)練的無(wú)人車,在通常的數(shù)據(jù)集上進(jìn)行訓(xùn)練后可能無(wú)法區(qū)分白色的箱式小貨車和閃著警報(bào)呼嘯而至的救護(hù)車。當(dāng)它在公路上行駛時(shí)救護(hù)車?guó)Q笛經(jīng)過(guò),由于它無(wú)法識(shí)別出救護(hù)車這個(gè)特殊的訓(xùn)練集中缺乏的車型(訓(xùn)練集中一般會(huì)標(biāo)注小貨車),它無(wú)法知曉此時(shí)需要減速和靠邊禮讓,而這樣的無(wú)人車在路上行駛時(shí)就帶來(lái)一系列無(wú)法預(yù)知的交通狀況。同樣的情形還會(huì)出現(xiàn)在與警車、消防車甚至校車同行的路段中。特備對(duì)于外賣快遞飛馳的電動(dòng)車、忽左忽右的自行車、隨處沖出的行人,無(wú)人駕駛系統(tǒng)更是無(wú)法處理如此復(fù)雜的路況!

為了解決這一問(wèn)題,研究人員提出了新的訓(xùn)練手段來(lái)對(duì)無(wú)人系統(tǒng)進(jìn)行更深入的訓(xùn)練和改進(jìn)。首先研究人員利用先前的方法通過(guò)模擬訓(xùn)練建立了人工智能系統(tǒng)。但當(dāng)系統(tǒng)在現(xiàn)實(shí)世界中運(yùn)行時(shí),會(huì)有人密切監(jiān)視該系統(tǒng)的行為,當(dāng)系統(tǒng)犯下或?qū)⒁赶氯魏五e(cuò)誤時(shí),人類會(huì)及時(shí)介入為系統(tǒng)提供人類的反饋意見(jiàn)。隨后研究人員將訓(xùn)練數(shù)據(jù)和人類反饋數(shù)據(jù)結(jié)合起來(lái),并使用機(jī)器學(xué)習(xí)技術(shù)來(lái)生成異常/盲點(diǎn)識(shí)別模型,該模型能夠準(zhǔn)確地指出該系統(tǒng)在哪些地方需要人類介入以便獲取更多的信息,從而來(lái)引導(dǎo)正確行為。

研究人員通過(guò)視頻游戲驗(yàn)證了這種方法,他們通過(guò)模擬讓人類糾正了視頻中人物的學(xué)習(xí)路徑。下一步是將該模型與傳統(tǒng)的訓(xùn)練和測(cè)試方法結(jié)合起來(lái),以便訓(xùn)練那些需要人類反饋意見(jiàn)的自動(dòng)學(xué)習(xí)系統(tǒng),比如自動(dòng)駕駛汽車和機(jī)器人。這個(gè)模型有助于自動(dòng)系統(tǒng)更好地了解它們不知道的東西,很多時(shí)候?qū)ο到y(tǒng)進(jìn)行訓(xùn)練時(shí),它們接受的模擬訓(xùn)練與現(xiàn)實(shí)世界發(fā)生的事件并不相符,而且系統(tǒng)可能犯錯(cuò),發(fā)生意外事故。這個(gè)模型可以用安全的方式以人類行為來(lái)彌補(bǔ)模擬和現(xiàn)實(shí)世界之間的差距。

一些傳統(tǒng)的訓(xùn)練方法確實(shí)在真實(shí)世界的測(cè)試中提供了人類反饋,但是僅僅是為了更新系統(tǒng)的行為動(dòng)作。這些方法不能識(shí)別人工智能系統(tǒng)的盲點(diǎn)。而這種新提出的模型首先將人工智能系統(tǒng)置于模擬訓(xùn)練中,人工智能系統(tǒng)將產(chǎn)生一些“策略”,將每種情況都映射到它在模擬中能采取的最佳行動(dòng)。然后該系統(tǒng)將被設(shè)置到現(xiàn)實(shí)世界中,當(dāng)系統(tǒng)行為錯(cuò)誤時(shí)人類將發(fā)出提醒信號(hào)。

人類可以通過(guò)多種方式提供數(shù)據(jù),例如通過(guò)“演示”和“修正”。在演示中,人類像在現(xiàn)實(shí)世界中那樣行動(dòng),系統(tǒng)對(duì)其進(jìn)行觀察,并將人類的行為和在這種情況下系統(tǒng)將采取的行為進(jìn)行比較。以無(wú)人駕駛汽車為例,如果汽車的計(jì)劃路線偏離了人類的意愿,人類會(huì)手動(dòng)控制汽車,這時(shí)系統(tǒng)就會(huì)發(fā)出信號(hào)。通過(guò)觀察人類行為相符或不相符的行為,為系統(tǒng)指出了哪些行為是可接受的,哪些行為是不可接受的。

同時(shí)人類還可以對(duì)系統(tǒng)進(jìn)行修正,當(dāng)系統(tǒng)在現(xiàn)實(shí)世界中工作時(shí),人類可以對(duì)其進(jìn)行監(jiān)控。司機(jī)可以坐在駕駛座上,而自動(dòng)駕駛汽車則沿著計(jì)劃的路線行駛。如果汽車的行駛是正確的,人類不進(jìn)行干預(yù)。如果汽車的行駛不正確,人類可能會(huì)重新控制車輛,這時(shí)系統(tǒng)就會(huì)發(fā)出信號(hào),表明在這種特定情況下汽車采取了不當(dāng)?shù)男袨椤?/p>

一旦匯集了來(lái)自人類的反饋數(shù)據(jù),系統(tǒng)就能構(gòu)建出一個(gè)各類情況數(shù)據(jù)庫(kù)。單個(gè)情況可以接收許多不同的信號(hào),也就是說(shuō)每種狀況可能有多個(gè)標(biāo)簽表示該行為是可接受的和不可接受的。例如,一輛自動(dòng)駕駛汽車可能已經(jīng)在一輛大車旁邊開(kāi)過(guò)了許多次而且沒(méi)有減速和停車,這是被認(rèn)可的。但是某次對(duì)系統(tǒng)來(lái)說(shuō)和大車完全一樣的救護(hù)車駛來(lái)時(shí),自動(dòng)駕駛汽車也沒(méi)有減速或者做出規(guī)避動(dòng)作,此時(shí)它就會(huì)收到一個(gè)反饋信號(hào):系統(tǒng)的行為不恰當(dāng)。

此刻,該系統(tǒng)已經(jīng)從人類那里得到了多個(gè)相互矛盾的信號(hào):有時(shí)它從大車旁邊不減速開(kāi)過(guò)去,是可以的;而在相同情況下,只是大車換成了救護(hù)車,不減速開(kāi)過(guò)去就不對(duì)。這時(shí)系統(tǒng)就會(huì)注意到它錯(cuò)了,但是它還不知道為什么錯(cuò),在收集了所有這些看起來(lái)相互矛盾的信號(hào)后,下一步就是整合信息并提出問(wèn)題:當(dāng)收到這些混合信號(hào)時(shí),犯下錯(cuò)誤的可能性有多大。

這一新模型的最終目標(biāo)是將這些模棱兩可的情況標(biāo)記為盲點(diǎn)。但這不僅僅是簡(jiǎn)單地計(jì)算每種情況下出現(xiàn)的可接受行為和不可接受行為的次數(shù)。例如如果該系統(tǒng)遇到救護(hù)車時(shí)十次中有九次采取正確的行動(dòng),就會(huì)將這種情況標(biāo)記為非盲點(diǎn)。但由于不恰當(dāng)行為遠(yuǎn)比恰當(dāng)行為出現(xiàn)的次數(shù)少,系統(tǒng)最終會(huì)學(xué)會(huì)預(yù)測(cè)所有的情況都不是盲點(diǎn),這對(duì)于實(shí)際系統(tǒng)來(lái)說(shuō)是極其危險(xiǎn)的。

為此研究人員使用一種通常用于眾包數(shù)據(jù)處理標(biāo)簽噪聲的Dawid - Skene機(jī)器學(xué)習(xí)方法來(lái)解決這一問(wèn)題。該算法將各類情況匯總數(shù)據(jù)庫(kù)作為輸入,每個(gè)情況都有“可接受”和“不可接受”的一對(duì)噪音標(biāo)簽。然后它聚集所有數(shù)據(jù),并使用一些概率計(jì)算方法來(lái)識(shí)別預(yù)測(cè)盲點(diǎn)標(biāo)簽?zāi)J胶皖A(yù)測(cè)非盲點(diǎn)標(biāo)簽?zāi)J?。使用這些信息它會(huì)為每種情況輸出一個(gè)整合的“非盲點(diǎn)”或“盲點(diǎn)”標(biāo)簽以及該標(biāo)簽的置信度。值得注意的是,即使在90%的情況下做出了可接受行為,該算法也可以通過(guò)學(xué)習(xí)把罕見(jiàn)的不可接受情況認(rèn)作盲點(diǎn)。最后該算法將生成了“熱圖”,系統(tǒng)在原始訓(xùn)練中經(jīng)歷的每種訓(xùn)練情況都被按照從低到高的盲點(diǎn)概率進(jìn)行排布。

當(dāng)系統(tǒng)被應(yīng)用到現(xiàn)實(shí)世界中時(shí),它可以利用該學(xué)習(xí)模型來(lái)更加謹(jǐn)慎和智能地行動(dòng)。如果學(xué)習(xí)模型預(yù)測(cè)某種狀態(tài)是高概率的盲點(diǎn),系統(tǒng)就可以咨詢?nèi)祟悜?yīng)該如何應(yīng)對(duì),從而更安全的行動(dòng)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 智能識(shí)別
    +關(guān)注

    關(guān)注

    0

    文章

    196

    瀏覽量

    18102
  • 自動(dòng)駕駛
    +關(guān)注

    關(guān)注

    782

    文章

    13633

    瀏覽量

    165989
  • 無(wú)人車
    +關(guān)注

    關(guān)注

    1

    文章

    299

    瀏覽量

    36451

原文標(biāo)題:MIT&微軟開(kāi)發(fā)智能識(shí)別新模型,幫助處理自動(dòng)駕駛系統(tǒng)的知識(shí)“盲點(diǎn)”

文章出處:【微信號(hào):thejiangmen,微信公眾號(hào):將門創(chuàng)投】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    研究人員提出一種電磁微鏡驅(qū)動(dòng)系統(tǒng)

    領(lǐng)域。MEMS微鏡作為一種微光機(jī)電系統(tǒng)(MOEMS),已廣泛應(yīng)用于醫(yī)療、汽車、消費(fèi)和軍事電子等眾多領(lǐng)域。當(dāng)前,業(yè)界對(duì)具有廣闊前景的小型激光雷達(dá)的需求不斷增長(zhǎng)。之前,已有研究
    的頭像 發(fā)表于 07-02 17:04 ?1.1w次閱讀

    MIT/三星研究人員利用活體拉曼光譜直接觀察葡萄糖指紋圖譜

    麻省理工學(xué)院(MIT,Cambridge, MA, USA)和三星(Samsung, Korea)的研究人員最近在《Science Advances》雜志上發(fā)表的篇論文展示了拉曼光譜法用于
    的頭像 發(fā)表于 06-05 06:35 ?313次閱讀
    <b class='flag-5'>MIT</b>/三星<b class='flag-5'>研究人員</b>利用活體拉曼光譜直接觀察葡萄糖指紋圖譜

    一種可實(shí)現(xiàn)穩(wěn)定壓力傳感的新型可拉伸電子皮膚

    現(xiàn)有的電子皮膚會(huì)隨材料拉伸而降低傳感精度。美國(guó)得克薩斯大學(xué)奧斯汀分校研究人員開(kāi)發(fā)出一種新型可拉伸電子皮膚,解決了這項(xiàng)新興技術(shù)的個(gè)主要難題。
    的頭像 發(fā)表于 05-09 09:07 ?424次閱讀

    研究人員利用定制光控制二維材料的量子特性

    的發(fā)展鋪平了道路。 由美國(guó)能源部SLAC國(guó)家加速器實(shí)驗(yàn)室和斯坦福大學(xué)研究人員領(lǐng)導(dǎo)的研究小組將這種方法應(yīng)用于一種名為六方氮化硼(hBN)的材料,這種材料由單層原子以蜂窩狀排列而成,其特性
    的頭像 發(fā)表于 05-06 06:29 ?214次閱讀
    <b class='flag-5'>研究人員</b>利用定制光控制二維材料的量子特性

    一種用于化學(xué)和生物材料識(shí)別的便攜式拉曼光譜解決方案

    基于掃頻光源的緊湊型拉曼光譜系統(tǒng):美國(guó)麻省理工學(xué)院(MIT)和韓國(guó)科學(xué)技術(shù)院(KAIST)的研究人員開(kāi)發(fā)一種
    的頭像 發(fā)表于 04-16 10:35 ?487次閱讀
    <b class='flag-5'>一種</b><b class='flag-5'>用于</b>化學(xué)和生物材料<b class='flag-5'>識(shí)別</b>的便攜式拉曼光譜解決方案

    印度開(kāi)發(fā)出一種用于顯示器和傳感器的可調(diào)諧彩色薄膜

    據(jù)麥姆斯咨詢報(bào)道,近日,印度科學(xué)研究所(Indian Institute of Science,簡(jiǎn)稱“IISc”)的研究團(tuán)隊(duì)開(kāi)發(fā)出一種柔性可調(diào)諧彩色薄膜,該薄膜不需要任何顏料,僅憑其物
    的頭像 發(fā)表于 04-10 09:06 ?478次閱讀

    無(wú)需電池、自供電,MIT開(kāi)發(fā)出新型傳感器

    電子發(fā)燒友網(wǎng)報(bào)道(文/吳子鵬)近日,麻省理工學(xué)院(MIT)的研究人員發(fā)表論文稱,該團(tuán)隊(duì)開(kāi)發(fā)出一種無(wú)需電池、自供電的傳感器,可以從環(huán)境中獲取能量。由于它不需要必須充電或更換電池,也不需
    的頭像 發(fā)表于 01-24 00:05 ?3224次閱讀
    無(wú)需電池、自供電,<b class='flag-5'>MIT</b><b class='flag-5'>開(kāi)發(fā)出</b>新型傳感器

    研究人員開(kāi)發(fā)出一種新型太赫茲成像系統(tǒng)

    系統(tǒng)使用的輻射探測(cè)器。 由加州大學(xué)洛杉磯分校Samueli工程學(xué)院電氣和計(jì)算機(jī)工程教授Mona Jarrahi和Aydogan Ozcan領(lǐng)導(dǎo)的研究團(tuán)隊(duì)發(fā)明了一種新的太赫茲焦平面陣列來(lái)解決這個(gè)問(wèn)題。 帶PSR的等離子體光電導(dǎo)TH
    的頭像 發(fā)表于 01-19 10:05 ?762次閱讀
    <b class='flag-5'>研究人員</b><b class='flag-5'>開(kāi)發(fā)出</b><b class='flag-5'>一種</b>新型太赫茲成像<b class='flag-5'>系統(tǒng)</b>

    【飛騰派4G版免費(fèi)試用】仙女姐姐的嵌入式實(shí)驗(yàn)室之五~LLaMA.cpp及3B“小模型”O(jiān)penBuddy-StableLM-3B

    訓(xùn)練是MetaAI研究人員認(rèn)為的一種降低模型使用成本的方式。為了更好的效果,即便是LLaMA最小的70億參數(shù)的版本,其訓(xùn)練使用的tokens數(shù)量也有1萬(wàn)億個(gè)(1 trillion tokens) 但是
    發(fā)表于 12-22 10:18

    LabVIEW進(jìn)行癌癥預(yù)測(cè)模型研究

    LabVIEW進(jìn)行癌癥預(yù)測(cè)模型研究 癌癥是一種細(xì)胞異常增生的疾病。隨著年齡的增長(zhǎng),細(xì)胞分裂速度放緩,但癌細(xì)胞會(huì)失去控制地不斷分裂,形成可能良性或惡性的腫瘤。 2012年的國(guó)際癌癥數(shù)據(jù)顯示,新發(fā)癌癥
    發(fā)表于 12-13 19:04

    研究人員創(chuàng)造一種六角形心電圖貼片 實(shí)現(xiàn)遙感與數(shù)據(jù)傳輸功能

    導(dǎo)? ? 語(yǔ)在《Applied Physics Reviews》期刊上,研究人員提出了一種新型可穿戴心電圖貼片,旨在增強(qiáng)床旁診斷,檢測(cè)心血管疾病并幫助評(píng)估整體心臟健康狀況。該研究的重點(diǎn)在于利用有源干
    的頭像 發(fā)表于 12-13 16:44 ?443次閱讀

    研究人員設(shè)計(jì)一種新的3D噴墨打印技術(shù)

    據(jù)悉,只帶韌帶和肌腱的骨骼機(jī)械手現(xiàn)在可以通過(guò)次3D打印完成 —— 這是通過(guò)一種新的增材制造方法實(shí)現(xiàn)的,這種方法可以同時(shí)以高分辨率打印剛性和彈性材料。 這項(xiàng)新工作是瑞士蘇黎世聯(lián)邦理工學(xué)院的
    的頭像 發(fā)表于 11-20 17:01 ?680次閱讀

    一種能夠模擬人類手指觸覺(jué)的人工感知系統(tǒng)可高分辨率識(shí)別精細(xì)紋理

    據(jù)麥姆斯咨詢報(bào)道,近日,南方科技大學(xué)聯(lián)合西安電子科技大學(xué)的研究人員開(kāi)發(fā)一種能夠模擬人類手指觸覺(jué)的人工感知系統(tǒng)
    的頭像 發(fā)表于 11-20 09:14 ?830次閱讀
    <b class='flag-5'>一種</b>能夠模擬人類手指觸覺(jué)的人工感知<b class='flag-5'>系統(tǒng)</b>可高分辨率<b class='flag-5'>識(shí)別</b>精細(xì)紋理

    研究人員開(kāi)發(fā)出定制薄膜的新方法

    爾層沉積工藝示意圖。 德國(guó)耶拿萊布尼茨光子技術(shù)研究所(Leibniz IPHT)領(lǐng)導(dǎo)的個(gè)德美科學(xué)家團(tuán)隊(duì)開(kāi)發(fā)出一種新方法,可自動(dòng)沉積具有明確特性的有機(jī)半導(dǎo)體薄膜。 這
    的頭像 發(fā)表于 11-17 16:09 ?382次閱讀
    <b class='flag-5'>研究人員</b><b class='flag-5'>開(kāi)發(fā)出</b>定制薄膜的新方法

    一種新的鈣鈦礦-晶硅疊層太陽(yáng)能電池開(kāi)發(fā)

    研究人員開(kāi)發(fā)一種新的鈣鈦礦-晶硅疊層太陽(yáng)能電池,該設(shè)計(jì)使用了一種禁帶寬度為1.67 eV的頂層鈣鈦礦電池和
    的頭像 發(fā)表于 11-16 09:37 ?870次閱讀
    <b class='flag-5'>一種</b>新的鈣鈦礦-晶硅疊層太陽(yáng)能電池<b class='flag-5'>開(kāi)發(fā)</b>