0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Facebook:有意讓機(jī)器人“犯錯(cuò)誤”,明知故犯是“智”也

電子工程師 ? 來(lái)源:YXQ ? 2019-05-24 08:43 ? 次閱讀

人類就是通過(guò)好奇心來(lái)認(rèn)識(shí)世界,機(jī)器人也可以。

在人們意識(shí)當(dāng)中,機(jī)器人按照開發(fā)者的意愿而做出指定的動(dòng)作似乎是一件理所應(yīng)當(dāng)?shù)氖?,而且,機(jī)器人完成任務(wù)還要做到精準(zhǔn)、迅速。然而,F(xiàn)acbook 的研究人員卻不走尋常路,他們有意讓機(jī)器人“犯錯(cuò)誤”,這到底是為什么呢?

讓我們一起來(lái)看看吧。

明知故犯是“智”也

在 Facebook 位于硅谷的新實(shí)驗(yàn)室里,有一個(gè)叫作 Sawyer 的機(jī)器人(來(lái)自已經(jīng)倒閉的 Rethink Robotics 公司),它紅黑相間的手臂揮舞著,試圖完成研究人員交給它的任務(wù)。

按照指令,Sawyer 的手臂應(yīng)該移動(dòng)到右邊一處固定位置,然而,Sawyer 把手臂抬高,然后偏離軌道,錯(cuò)開了指定位置,重新回到了原點(diǎn);研究人員只好將 Sawyer 重置,讓它繼續(xù)完成之前的任務(wù)。這一次,Sawyer 的手臂確實(shí)往右移了,但就在非常接近指定位置的時(shí)候,它再一次偏離了運(yùn)動(dòng)軌道,回到了起始位置。兩次任務(wù)都失敗了。

或許有人會(huì)覺得 Sawyer 的“頑劣”行為令人抓狂。但就像兔子為了躲避獵鷹而迂回前進(jìn)一樣,Sawyer 看似笨拙的行為實(shí)際上是一種特殊的聰明。

Facebook 認(rèn)為,無(wú)論是對(duì)于機(jī)器人的開發(fā),還是 AI 的開發(fā)來(lái)說(shuō),這種聰明都至關(guān)重要。

強(qiáng)化學(xué)習(xí)讓機(jī)器人更“聰明”

一般來(lái)說(shuō),開發(fā)者會(huì)編程機(jī)器人,讓他們通過(guò)這些設(shè)定好的指令來(lái)執(zhí)行動(dòng)作,不過(guò)從某種程度上來(lái)說(shuō),這種方式有點(diǎn)死板。

而我們?nèi)祟愒趯W(xué)習(xí)上則要聰明得多。因?yàn)?,即使是嬰兒也明白,物體從視野中消失并不代表從世界上消失;玩具球可以滾來(lái)滾去,沙發(fā)卻不行;長(zhǎng)大后,人們能夠?qū)W習(xí)駕駛,而不是撞車。

這一切都要?dú)w功于人類大腦里建立起來(lái)的世界模型。

Facebook 首席 AI 科學(xué)家 Yann LeCun 表示:

如果我們?cè)趹已逻呴_車,方向盤只要往右轉(zhuǎn),汽車就會(huì)掉下去,所以,我們絕不會(huì)這樣做。我們大腦里的世界模型會(huì)阻止我們自己做傻事。

Facebook 也在嘗試為機(jī)器提供這種模式,Yann LeCun 補(bǔ)充道說(shuō),建立世界模型的系統(tǒng)是 AI 取得重大進(jìn)展的下一個(gè)挑戰(zhàn)。

實(shí)際上,F(xiàn)acebook 并不是第一個(gè)嘗試讓機(jī)器人學(xué)會(huì)自我移動(dòng)的團(tuán)隊(duì)。

雷鋒網(wǎng)注:上圖為 Brett 機(jī)器人及其開發(fā)者Pieter Abbeel

在加州大學(xué)伯克利分校,研究人員使用了一種名為強(qiáng)化學(xué)習(xí)(reinforcement learning)的技術(shù),讓雙臂機(jī)器人 Brett 把方形釘子塞進(jìn)一個(gè)方形洞里。

在此過(guò)程中,研究人員會(huì)讓 Brett 嘗試許許多多隨機(jī)的動(dòng)作:如果 Brett 更接近目標(biāo),系統(tǒng)就會(huì)給它“獎(jiǎng)勵(lì)”;如果 Brett 搞砸了,系統(tǒng)會(huì)給它“記過(guò)”。

這些記錄,Brett 都會(huì)保存下來(lái),然后經(jīng)過(guò)多次迭代,它會(huì)越來(lái)越精準(zhǔn)地找到方洞,并把釘子放進(jìn)去。

創(chuàng)新的自我監(jiān)督學(xué)習(xí)

而 Facebook 的嘗試有點(diǎn)不同,F(xiàn)acebook AI 研究科學(xué)家 Franziska Meier 表示:

我們想嘗試的是給機(jī)器人灌輸好奇心的概念。

人類就是通過(guò)好奇心來(lái)認(rèn)識(shí)世界的,比如,孩子們想知道猛拽貓尾巴會(huì)發(fā)生什么,所以他們會(huì)去做這種嘗試。因此,Brett 是通過(guò)一點(diǎn)一點(diǎn)地靠近目標(biāo),來(lái)改進(jìn)自己的動(dòng)作,而 Facebook 的 Sawyer 則是靠近目標(biāo),然后故意偏離軌道。

Facebook 研究人員旨在讓 Sawyer 自由地嘗試非最佳動(dòng)作,而不是獎(jiǎng)勵(lì)它不斷取得的成功,即使這在當(dāng)時(shí)看起來(lái)并不理性。Meier 說(shuō):

雖然 Sawyer 沒有完成任務(wù),但它給了我們更多的數(shù)據(jù),我們通過(guò)這種方式獲得的數(shù)據(jù)比傳統(tǒng)的方式要多。

這個(gè)概念被稱為自我監(jiān)督學(xué)習(xí)——機(jī)器人嘗試新行為并更新軟件模型,從而幫助它預(yù)測(cè)自己的行為后果。

上圖為 Facebook 所說(shuō)的“自我監(jiān)督學(xué)習(xí)”的算法模型

這樣做的目的是讓機(jī)器能夠更加靈活地去完成任務(wù),或者說(shuō),更容易適應(yīng)動(dòng)態(tài)的人類環(huán)境。

比如,機(jī)器人要將架子上的杯子放到旁邊的架子,最好的方法是將杯子直接平移,然而兩個(gè)架子之間有隔板,這就需要機(jī)器人反復(fù)試驗(yàn)、反復(fù)犯錯(cuò),直到它探索出更好的解決方案。

正如奧斯陸大學(xué)的機(jī)器人專家 Tonnes Nygaard 所說(shuō)的那樣:

如果我們一直執(zhí)著于一個(gè)解決方案,我們可能會(huì)走進(jìn)死胡同;我們更應(yīng)該專注于探索更多新的解決方案。

模擬與現(xiàn)實(shí)之間的差距

一些研究人員通過(guò)模擬來(lái)教機(jī)器人完成任務(wù)——建立一個(gè)數(shù)字世界,再讓其中的動(dòng)畫對(duì)象通過(guò)“犯錯(cuò)”的方式來(lái)完成任務(wù)。這種方法相對(duì)較快,因?yàn)楫?dāng)數(shù)字“機(jī)器”不受現(xiàn)實(shí)世界物理定律的約束,它們迭代的速度要快得多。

不過(guò),雖然模擬更高效,但它并不能完美地反映真實(shí)世界,模擬動(dòng)態(tài)人類環(huán)境的復(fù)雜性。

這就導(dǎo)致,機(jī)器人在模擬環(huán)境中能夠完美匹配的理論,在現(xiàn)實(shí)世界中卻不適用。在現(xiàn)實(shí)世界中做任何事情都可能更慢、更費(fèi)力,但好處是,機(jī)器人能獲得的數(shù)據(jù)更純粹。

Facebook的人工智能研究科學(xué)家 Roberto Calandra 表示:

如果它在現(xiàn)實(shí)世界中行得通,那它就真的行得通。

畢竟,機(jī)器人在現(xiàn)實(shí)世界中要面對(duì)各種意想不到的麻煩,程序員不可能對(duì)每一個(gè)都預(yù)先進(jìn)行編碼。

AI 和機(jī)器人相得益彰

上圖是 Facebook 的六足機(jī)器人

從某種程度上來(lái)說(shuō),F(xiàn)acebook 的項(xiàng)目是 AI 和機(jī)器人的偉大融合。

雖然谷歌和亞馬遜和 Facebook 等科技巨頭已經(jīng)大大推動(dòng)了 AI 的發(fā)展,比如讓機(jī)器進(jìn)行圖像識(shí)別,不過(guò)這個(gè)任務(wù)仍基于人們事先給圖片貼好標(biāo)簽。不得不承認(rèn),機(jī)器還是不夠聰明。

隨著 AI 研究人員開始使用機(jī)器人作為平臺(tái)來(lái)改進(jìn)軟件算法,這種情況開始發(fā)生變化。

例如,F(xiàn)acebook 教機(jī)器人獨(dú)立完成一系列任務(wù),這反過(guò)來(lái)可能會(huì)對(duì)開發(fā) AI 助手有所啟發(fā),讓它們能夠更好地為用戶服務(wù)。LeCun 說(shuō)道:

如果機(jī)器人解決了一個(gè)問(wèn)題,同理,它也能在另一種情況下解決這個(gè)問(wèn)題。

簡(jiǎn)而言之就是,AI 正在讓機(jī)器人變得更聰明,而機(jī)器人也在幫助推進(jìn) AI 的發(fā)展。

不過(guò),F(xiàn)acebook 表示,目前,公司的這項(xiàng)研究并沒有連接到特定的產(chǎn)品。不過(guò),LeCun 說(shuō):

我們認(rèn)為,機(jī)器人將在遠(yuǎn)程呈現(xiàn)中發(fā)揮重要作用。畢竟,F(xiàn)acebook 擁有 Portal 和 Oculus VR 系統(tǒng)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 機(jī)器人
    +關(guān)注

    關(guān)注

    210

    文章

    27847

    瀏覽量

    204663
  • Facebook
    +關(guān)注

    關(guān)注

    3

    文章

    1429

    瀏覽量

    54479

原文標(biāo)題:Facebook:不會(huì)“犯錯(cuò)”的機(jī)器人,不是“聰明”的機(jī)器人

文章出處:【微信號(hào):smartman163,微信公眾號(hào):網(wǎng)易智能】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    AMD贊助多支FIRST機(jī)器人競(jìng)賽團(tuán)隊(duì)

    AMD 在 2024 賽季贊助了多支 FIRST 機(jī)器人競(jìng)賽團(tuán)隊(duì)。FIRST 機(jī)器人競(jìng)賽旨在教導(dǎo)高中生如何構(gòu)建能夠執(zhí)行特定任務(wù)的機(jī)器人,同時(shí)
    的頭像 發(fā)表于 09-18 09:45 ?244次閱讀

    工業(yè)機(jī)器人常用的編程方式

    機(jī)器人完成特定的任務(wù)。編程可以手動(dòng)完成,可以通過(guò)計(jì)算機(jī)輔助設(shè)計(jì)(CAD)軟件自動(dòng)生成。編程方式的選擇取決于任務(wù)的復(fù)雜性、機(jī)器人的類型、以及所需的靈活性和效率。 1. 手動(dòng)編程 1.1 示教編程 直接示教 :操作員直接控制
    的頭像 發(fā)表于 09-04 09:26 ?193次閱讀

    開源項(xiàng)目!用ESP32做一個(gè)可愛的無(wú)用機(jī)器人

    /Kawaii-Useless-Robot 可以“可愛的無(wú)用機(jī)器人”打包下載所有3D打印文件。 項(xiàng)目鏈接:https://www.instructables.com/Kawaii-Useless-Robot-2024-Edition/ 項(xiàng)目作者:tobychui *附件
    發(fā)表于 09-03 09:34

    ROS機(jī)器人開發(fā)更便捷,基于RK3568J+Debian系統(tǒng)發(fā)布!

    本帖最后由 Tronlong創(chuàng)龍科技 于 2024-7-19 17:18 編輯 ROS系統(tǒng)是什么 ROS(Robot Operating System)是一個(gè)適用于機(jī)器人的開源的元操作系統(tǒng)。它
    發(fā)表于 07-09 11:38

    Al大模型機(jī)器人

    金航標(biāo)kinghelm薩科微slkor總經(jīng)理宋仕強(qiáng)介紹說(shuō),薩科微Al大模型機(jī)器人有哪些的優(yōu)勢(shì)?薩科微AI大模型機(jī)器人由清華大學(xué)畢業(yè)的天才少年N博士和王博士團(tuán)隊(duì)開發(fā),與同行相比具有許多優(yōu)勢(shì):語(yǔ)言
    發(fā)表于 07-05 08:52

    其利天下技術(shù)·搭載無(wú)刷電機(jī)的掃地機(jī)器人的前景如何?

    隨著人工智能和物聯(lián)網(wǎng)技術(shù)的不斷進(jìn)步,掃地機(jī)器人的智能化程度在不斷提高?,F(xiàn)代掃地機(jī)器人已經(jīng)可以通過(guò)智能識(shí)別、規(guī)劃路徑和自主避障等技術(shù),實(shí)現(xiàn)更為精準(zhǔn)的清潔。它們可以根據(jù)家居環(huán)境自動(dòng)調(diào)整清潔策略,如識(shí)別
    發(fā)表于 05-05 15:03

    PCB行業(yè):用協(xié)作機(jī)器人,就選大族機(jī)器人

    近年來(lái),電子產(chǎn)業(yè)的爆發(fā)式需求,PCB行業(yè)迎來(lái)了快速發(fā)展的同時(shí),帶來(lái)了更加激烈的行業(yè)競(jìng)爭(zhēng)。為了在擁擠的風(fēng)口屹立不倒,許多PCB廠家選用協(xié)作安全、柔性生產(chǎn)、使用簡(jiǎn)單和部署快捷的協(xié)作機(jī)器人,作為PCB
    的頭像 發(fā)表于 02-29 09:34 ?347次閱讀

    特種機(jī)器人的定義與分類

    相對(duì)于一般的工業(yè)機(jī)器人及家用服務(wù)機(jī)器人,特種機(jī)器人的工作環(huán)境和作業(yè)條件更為復(fù)雜,對(duì)機(jī)器人結(jié)構(gòu)和功能提出了更高的要求。因此,未來(lái)特種
    發(fā)表于 01-04 11:42 ?1331次閱讀
    特種<b class='flag-5'>機(jī)器人</b>的定義與分類

    LabVIEW的六軸工業(yè)機(jī)器人運(yùn)動(dòng)控制系統(tǒng)

    LabVIEW開發(fā)六軸工業(yè)機(jī)器人運(yùn)動(dòng)控制系統(tǒng) 本項(xiàng)目開發(fā)了一個(gè)高效的工業(yè)機(jī)器人控制系統(tǒng),重點(diǎn)關(guān)注于運(yùn)動(dòng)學(xué)算法和軌跡規(guī)劃算法的實(shí)現(xiàn)和測(cè)試。LabVIEW作為一個(gè)關(guān)鍵技術(shù),在項(xiàng)目中扮演了核心角色
    發(fā)表于 12-21 20:03

    機(jī)器人實(shí)現(xiàn)開發(fā)自由,探索精密工藝的機(jī)器人關(guān)節(jié)模組

    機(jī)器人關(guān)節(jié)是作為機(jī)器人各個(gè)部件之間相互連接的節(jié)點(diǎn),提供了必要的運(yùn)動(dòng)自由度。關(guān)節(jié)模組用其精確度和可靠性,確保了機(jī)器人在各個(gè)領(lǐng)域的高效率和高質(zhì)量表現(xiàn)。一體化關(guān)節(jié)使得機(jī)器人能夠模擬人類肢體的
    的頭像 發(fā)表于 12-08 15:35 ?392次閱讀

    ROS機(jī)器人開發(fā)更便捷,基于RK3568J+Debian系統(tǒng)發(fā)布!

    ROS系統(tǒng)是什么 ROS(Robot Operating System)是一個(gè)適用于機(jī)器人的開源的元操作系統(tǒng)。它提供了操作系統(tǒng)應(yīng)有的服務(wù),包括硬件抽象,底層設(shè)備控制,常用函數(shù)的實(shí)現(xiàn),進(jìn)程間消息傳遞
    發(fā)表于 11-30 16:01

    機(jī)器人建模方法和組成

    URDF:機(jī)器人建模方法 ROS是機(jī)器人操作系統(tǒng),當(dāng)然要給機(jī)器人使用啦,不過(guò)在使用之前,還得ROS認(rèn)識(shí)下我們使用的機(jī)器人,如何把一個(gè)
    的頭像 發(fā)表于 11-22 16:30 ?758次閱讀
    <b class='flag-5'>機(jī)器人</b>建模方法和組成

    機(jī)器人編程需要什么軟件?

    機(jī)器人編程需要什么軟件
    發(fā)表于 11-01 07:34

    利用Arduino機(jī)器人學(xué)會(huì)識(shí)別標(biāo)識(shí)并作出行為

    教你用Arduino機(jī)器人學(xué)會(huì)識(shí)別標(biāo)識(shí)并作出行為。你的人工智能小車從此有了眼睛!材料單:跟蹤機(jī)器人底盤視覺傳感器Arduino Uno電動(dòng)機(jī)驅(qū)動(dòng)板18650 Li-離子電池
    發(fā)表于 09-27 07:36

    Arduino教學(xué)機(jī)器人的使用教程

    本文檔的主要內(nèi)容詳細(xì)介紹的是Arduino教學(xué)機(jī)器人的使用教程
    發(fā)表于 09-27 06:53