骚虎影院桃红国产在线观看,亚洲mv大片欧洲mv大片,欧美日韩狠狠爱视频a片

由視覺輸入控制的機(jī)器人非常依賴于固定視角的攝像頭，這意味著它們難以在活動(dòng)的情況下精確完成任務(wù)。近日，谷歌研究人員提出了一種結(jié)合卷積神經(jīng)網(wǎng)絡(luò)和 LSTM 的新架構(gòu)，可通過強(qiáng)化學(xué)習(xí)等方法在接收多個(gè)攝像頭、不同視角圖像輸入的情況下控制機(jī)械臂準(zhǔn)確完成任務(wù)。研究人員稱，新方法可以擴(kuò)展到任何類型的自動(dòng)自校準(zhǔn)任務(wù)上。

人們非常擅長(zhǎng)在不將視點(diǎn)調(diào)整到某一固定或特殊位置的情況下操縱物體。這種能力（我們稱之為「視覺動(dòng)作整合」）在孩童時(shí)期通過在多種情形中操縱物體而習(xí)得，并由一種利用豐富的感官信號(hào)和視覺作為反饋的自適應(yīng)糾錯(cuò)機(jī)制控制。然而，在機(jī)器人學(xué)中，基于視覺的控制器很難獲得這種能力，目前來看，這種控制器都基于一種用來從固定安裝的攝像頭讀取視覺輸入數(shù)據(jù)的固定裝置。在視點(diǎn)大幅變化的情況下快速獲取視覺運(yùn)動(dòng)控制技能的能力將對(duì)自動(dòng)機(jī)器人系統(tǒng)產(chǎn)生重大影響——例如，這種能力對(duì)于參與救援工作或在災(zāi)區(qū)作業(yè)的機(jī)器人來說尤其必要。

在 CVPR 2018 會(huì)議中，谷歌提交了一篇名為《Sim2Real Viewpoint Invariant Visual Servoing by Recurrent Control》的論文。在這篇論文中，谷歌研究了一種新的深度網(wǎng)絡(luò)架構(gòu)（包含兩個(gè)全卷積網(wǎng)絡(luò)和一個(gè)長(zhǎng)短期記憶單元），該架構(gòu)從過去的動(dòng)作和觀測(cè)結(jié)果中學(xué)習(xí)自我校準(zhǔn)。其視覺適應(yīng)網(wǎng)絡(luò)（visually-adaptive network）利用由演示軌跡和強(qiáng)化學(xué)習(xí)目標(biāo)組成的各種模擬數(shù)據(jù)，能夠從各種視點(diǎn)控制機(jī)械臂到達(dá)視覺指示的各種目標(biāo)，并且獨(dú)立于攝像機(jī)校準(zhǔn)。

用物理機(jī)械臂實(shí)現(xiàn)視覺指示目標(biāo)的視點(diǎn)不變操作。新方法學(xué)習(xí)了一種單一策略，通過從截然不同的攝像機(jī)視點(diǎn)捕獲的感官輸入來到達(dá)不同的目標(biāo)。第一行顯示了視覺指示的目標(biāo)。

挑戰(zhàn)

從未知視點(diǎn)捕獲的單一圖像中探索可控自由度（DoF）如何影響視覺運(yùn)動(dòng)可能不夠明確和具體。確定動(dòng)作對(duì)圖像-空間運(yùn)動(dòng)的影響并成功地執(zhí)行預(yù)期任務(wù)需要一個(gè)對(duì)過去動(dòng)作記憶的保持能力進(jìn)行增強(qiáng)的魯棒感知系統(tǒng)。要解決這個(gè)具有挑戰(zhàn)性的問題，必須解決以下基本問題：

●如何提供適當(dāng)?shù)慕?jīng)驗(yàn)，讓機(jī)器人在模擬終身學(xué)習(xí)模式的純視覺觀察的基礎(chǔ)上學(xué)習(xí)自適應(yīng)行為？

●如何設(shè)計(jì)一個(gè)將魯棒感知和自適應(yīng)控制整合起來并能快速遷移到未見環(huán)境中的模型？

為了解決以上問題，研究人員設(shè)計(jì)了一種新的操縱任務(wù)，給一個(gè)七自由度機(jī)械臂提供一個(gè)物體的圖像，并命令它在一系列干擾物中拿到特定的目標(biāo)物體，同時(shí)每一次嘗試的視點(diǎn)會(huì)發(fā)生劇烈變化。采用這種做法，研究人員能夠模擬復(fù)雜行為的學(xué)習(xí)以及向未知環(huán)境的遷移。

用物理機(jī)械臂和各種攝像機(jī)視點(diǎn)完成到達(dá)視覺指示目標(biāo)的任務(wù)。

利用模擬來學(xué)習(xí)復(fù)雜行為

收集機(jī)器人經(jīng)驗(yàn)數(shù)據(jù)費(fèi)時(shí)費(fèi)力。在過去的一篇博文中，谷歌展示了如何通過將數(shù)據(jù)收集和試驗(yàn)分配給多個(gè)機(jī)器人來擴(kuò)展學(xué)習(xí)技能。盡管該方法加快了學(xué)習(xí)進(jìn)度，但它仍然不適合擴(kuò)展到復(fù)雜行為的學(xué)習(xí)中（如視覺自校準(zhǔn)），后者需要將機(jī)器人置于一個(gè)包含各種視點(diǎn)的大型空間中。因此，研究人員選擇在模擬環(huán)境中學(xué)習(xí)此類復(fù)雜行為，在模擬中可以收集無限的機(jī)器人試驗(yàn)數(shù)據(jù)，并輕松將攝像頭移動(dòng)到各個(gè)隨機(jī)視點(diǎn)。除了在模擬中快速收集數(shù)據(jù)之外，該方法還可以突破需要在機(jī)器人周圍安裝多個(gè)攝像機(jī)的硬件限制。

谷歌研究人員在模擬環(huán)境中使用域隨機(jī)化技術(shù)來學(xué)習(xí)可泛化的策略。

為了學(xué)習(xí)足以遷移到未知環(huán)境的視覺魯棒特征，研究人員使用了 Sadeghi 與 Levine 在 2017 年提出的域隨機(jī)化技術(shù)（即模擬隨機(jī)化），它可令機(jī)器人完全在模擬環(huán)境中學(xué)習(xí)基于視覺的策略，并可以推廣到現(xiàn)實(shí)世界。該技術(shù)在諸如室內(nèi)導(dǎo)航、物體定位、拾取和放置等多種機(jī)器人任務(wù)上效果良好。此外，為了學(xué)習(xí)像自校準(zhǔn)這樣的復(fù)雜行為，研究人員利用模擬能力生成合成示例，并結(jié)合強(qiáng)化學(xué)習(xí)目標(biāo)來學(xué)習(xí)魯棒的機(jī)械臂控制器。

使用模擬的 7 自由度機(jī)械臂實(shí)現(xiàn)視覺指示目標(biāo)的視點(diǎn)不變操作。新方法學(xué)習(xí)了一種單一策略，可以通過不同相機(jī)視角捕捉的感官輸入實(shí)現(xiàn)不同的目標(biāo)。

在控制中解構(gòu)感知

為了更快地將知識(shí)遷移到未知環(huán)境中，谷歌研究人員設(shè)計(jì)了一個(gè)深度神經(jīng)網(wǎng)絡(luò)，將感知和控制相結(jié)合，并同時(shí)進(jìn)行端到端訓(xùn)練，且在必要情況下允許二者分別進(jìn)行訓(xùn)練。感知與控制之間的分離使遷移到未知環(huán)境的難度減小，也讓模型更加靈活和高效，因?yàn)槊總€(gè)部分（即「感知」和「控制」）都可以單獨(dú)適應(yīng)僅有少量數(shù)據(jù)的新環(huán)境。另外，雖然神經(jīng)網(wǎng)絡(luò)中的控制部分完全由模擬數(shù)據(jù)進(jìn)行訓(xùn)練，但感知部分經(jīng)過物體邊界框收集的少量靜態(tài)圖像補(bǔ)充了輸入，無需讓物理機(jī)器人收集完整的動(dòng)作序列軌跡。在實(shí)踐中，谷歌研究人員只用了來自 22 張圖像的 76 個(gè)對(duì)象邊界框來微調(diào)網(wǎng)絡(luò)的感知部分。

真實(shí)世界的機(jī)器人和移動(dòng)攝像頭設(shè)置。第一行展示了場(chǎng)景布置，第二行顯示了機(jī)器人接收到的視覺感官輸入。

早期結(jié)果

谷歌研究人員在物理機(jī)器人和真實(shí)物體上測(cè)試了視覺適應(yīng)版本的網(wǎng)絡(luò)，這些物體的外形與模擬環(huán)境中使用的完全不同。在實(shí)驗(yàn)中，桌子上會(huì)出現(xiàn)一個(gè)或兩個(gè)物體：「見過的物體」（如下圖所示）用于視覺適應(yīng)，實(shí)驗(yàn)中使用的是小型靜態(tài)真實(shí)圖像集。在視覺適應(yīng)期間不會(huì)看到「未見過的物體」。在測(cè)試中，機(jī)械臂被引導(dǎo)從各個(gè)視點(diǎn)到達(dá)視覺指示目標(biāo)物體。對(duì)于雙對(duì)象實(shí)驗(yàn)，第二個(gè)對(duì)象用于讓機(jī)械臂產(chǎn)生「混淆」。因?yàn)榧兡M網(wǎng)絡(luò)具有良好的泛化能力（因?yàn)樗窃谟螂S機(jī)技術(shù)之上進(jìn)行訓(xùn)練的），模型的網(wǎng)絡(luò)架構(gòu)非常靈活，因此雖然實(shí)驗(yàn)中僅收集了非常少量的真實(shí)靜態(tài)視覺數(shù)據(jù)用于視覺適應(yīng)，但控制器的表現(xiàn)仍然有了很大提升。

在視覺特征和少量真實(shí)圖像進(jìn)行適應(yīng)之后，模型性能提高了 10% 以上。其中所有用到的真實(shí)物體都與模擬中看到的截然不同。

谷歌研究人員認(rèn)為，學(xué)習(xí)在線視覺自適應(yīng)是一個(gè)重要而具有挑戰(zhàn)性的問題，這一方向的目標(biāo)是學(xué)習(xí)到可在多樣化和非結(jié)構(gòu)化的現(xiàn)實(shí)世界中運(yùn)行的機(jī)器人所需要的通用化策略。新方法可以擴(kuò)展到任何類型的自動(dòng)自我校準(zhǔn)上。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

機(jī)器人

機(jī)器人

+關(guān)注

關(guān)注
210

文章
27839

瀏覽量
204605
谷歌

谷歌

+關(guān)注

關(guān)注
27

文章
6080

瀏覽量
104371
神經(jīng)網(wǎng)絡(luò)

神經(jīng)網(wǎng)絡(luò)

+關(guān)注

關(guān)注
42

文章
4717

瀏覽量
100015

原文標(biāo)題：資訊 | 谷歌提出Sim2Real：讓機(jī)器人像人類一樣觀察世界

文章出處：【微信號(hào)：SRA2009，微信公眾號(hào)：深圳市機(jī)器人協(xié)會(huì)】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

評(píng)論

相關(guān)推薦

什么是卷積神經(jīng)網(wǎng)絡(luò)？完整的卷積神經(jīng)網(wǎng)絡(luò)（CNNS）解析

卷積神經(jīng)網(wǎng)絡(luò)（CNN）是一種特殊類型的神經(jīng)網(wǎng)絡(luò)，在圖像上表現(xiàn)特別出色。卷積神經(jīng)網(wǎng)絡(luò)由Yan Le

發(fā)表于 08-10 11:49 ?1.9w次閱讀

使用PyTorch深度解析卷積神經(jīng)網(wǎng)絡(luò)

發(fā)表于 09-21 10:12 ?772次閱讀

卷積神經(jīng)網(wǎng)絡(luò)如何使用

卷積神經(jīng)網(wǎng)絡(luò)(CNN)究竟是什么，鑒于神經(jīng)網(wǎng)絡(luò)在工程上經(jīng)歷了曲折的歷史，您為什么還會(huì)在意它呢? 對(duì)于這些非常中肯的問題，我們似乎可以給出相對(duì)簡(jiǎn)明的答案。

發(fā)表于 07-17 07:21

什么是LSTM神經(jīng)網(wǎng)絡(luò)

簡(jiǎn)單理解LSTM神經(jīng)網(wǎng)絡(luò)

發(fā)表于 01-28 07:16

卷積神經(jīng)網(wǎng)絡(luò)一維卷積的處理過程

。本文就以一維卷積神經(jīng)網(wǎng)絡(luò)為例談?wù)勗趺磥磉M(jìn)一步優(yōu)化卷積神經(jīng)網(wǎng)絡(luò)使用的memory。文章（

發(fā)表于 12-23 06:16

卷積神經(jīng)網(wǎng)絡(luò)模型發(fā)展及應(yīng)用

十余年來快速發(fā)展的嶄新領(lǐng)域，越來越受到研究者的關(guān)注。卷積神經(jīng)網(wǎng)絡(luò)（CNN）模型是深度學(xué)習(xí)模型中最重要的一種經(jīng)典結(jié)構(gòu)，其性能在近年來深度學(xué)習(xí)任務(wù)上逐步提高。由于可以自動(dòng)學(xué)習(xí)樣本數(shù)據(jù)的特征表示，卷

發(fā)表于 08-02 10:39

《 AI加速器架構(gòu)設(shè)計(jì)與實(shí)現(xiàn)》+第一章卷積神經(jīng)網(wǎng)絡(luò)觀后感

連接塊是一種模塊，通常用于深度卷積神經(jīng)網(wǎng)絡(luò)中，特別是在殘差網(wǎng)絡(luò)（Residual Network，ResNet）中廣泛使用，也是我比較熟悉的。組卷積

發(fā)表于 09-11 20:34

一種卷積神經(jīng)網(wǎng)絡(luò)和極限學(xué)習(xí)機(jī)相結(jié)合的人臉識(shí)別方法_余丹

一種卷積神經(jīng)網(wǎng)絡(luò)和極限學(xué)習(xí)機(jī)相結(jié)合的人臉識(shí)別方法_余丹

發(fā)表于 01-08 11:20 ?0次下載

結(jié)合小波變換的LSTM循環(huán)神經(jīng)網(wǎng)絡(luò)的稅收預(yù)測(cè)

分析歷史稅收數(shù)據(jù)之間的隱藏關(guān)系，利用數(shù)學(xué)模型來預(yù)測(cè)未來的稅收收入是稅收預(yù)測(cè)的研究重點(diǎn)。在此，提出了一種結(jié)合小波變換的長(zhǎng)短期記憶（LSTM循環(huán)神經(jīng)網(wǎng)絡(luò)

發(fā)表于 04-28 11:26 ?10次下載

卷積神經(jīng)網(wǎng)絡(luò)原理：卷積神經(jīng)網(wǎng)絡(luò)模型和卷積神經(jīng)網(wǎng)絡(luò)算法

卷積神經(jīng)網(wǎng)絡(luò)原理：卷積神經(jīng)網(wǎng)絡(luò)模型和卷積神經(jīng)網(wǎng)絡(luò)算法卷積

發(fā)表于 08-17 16:30 ?1270次閱讀

卷積神經(jīng)網(wǎng)絡(luò)概述卷積神經(jīng)網(wǎng)絡(luò)的特點(diǎn) cnn卷積神經(jīng)網(wǎng)絡(luò)的優(yōu)點(diǎn)

卷積神經(jīng)網(wǎng)絡(luò)概述卷積神經(jīng)網(wǎng)絡(luò)的特點(diǎn) cnn卷積神經(jīng)網(wǎng)絡(luò)的優(yōu)點(diǎn)?

發(fā)表于 08-21 16:41 ?2604次閱讀

卷積神經(jīng)網(wǎng)絡(luò)的基本原理卷積神經(jīng)網(wǎng)絡(luò)發(fā)展卷積神經(jīng)網(wǎng)絡(luò)三大特點(diǎn)

中最重要的神經(jīng)網(wǎng)絡(luò)之一。它是一種由多個(gè)卷積層和池化層（也可稱為下采樣層）組成的神經(jīng)網(wǎng)絡(luò)。CNN 的基本思想是以圖像為輸入，通過

發(fā)表于 08-21 16:49 ?2106次閱讀

卷積神經(jīng)網(wǎng)絡(luò)層級(jí)結(jié)構(gòu) 卷積神經(jīng)網(wǎng)絡(luò)的卷積層講解

卷積神經(jīng)網(wǎng)絡(luò)層級(jí)結(jié)構(gòu) 卷積神經(jīng)網(wǎng)絡(luò)的卷積層講解卷積神經(jīng)網(wǎng)絡(luò)

發(fā)表于 08-21 16:49 ?6847次閱讀

卷積神經(jīng)網(wǎng)絡(luò)的介紹什么是卷積神經(jīng)網(wǎng)絡(luò)算法

的深度學(xué)習(xí)算法。CNN模型最早被提出是為了處理圖像，其模型結(jié)構(gòu)中包含卷積層、池化層和全連接層等關(guān)鍵技術(shù)，經(jīng)過多個(gè)卷積層和池化層的處理，CNN可以提取出圖像中的特征信息，從而對(duì)圖像進(jìn)行分類。一

發(fā)表于 08-21 16:49 ?1701次閱讀

卷積神經(jīng)網(wǎng)絡(luò)的原理與實(shí)現(xiàn)

1.卷積神經(jīng)網(wǎng)絡(luò)（Convolutional Neural Networks，簡(jiǎn)稱CNN）是一種深度學(xué)習(xí)模型，廣泛應(yīng)用于圖像識(shí)別、視頻分析、自然語言處理等領(lǐng)域。卷積

發(fā)表于 07-02 16:47 ?325次閱讀

搜索歷史

谷歌提出一種結(jié)合卷積神經(jīng)網(wǎng)絡(luò)和LSTM的新架構(gòu)

評(píng)論

什么是卷積神經(jīng)網(wǎng)絡(luò)？完整的卷積神經(jīng)網(wǎng)絡(luò)（CNNS）解析

使用PyTorch深度解析卷積神經(jīng)網(wǎng)絡(luò)

卷積神經(jīng)網(wǎng)絡(luò)如何使用

什么是LSTM神經(jīng)網(wǎng)絡(luò)

卷積神經(jīng)網(wǎng)絡(luò)一維卷積的處理過程

卷積神經(jīng)網(wǎng)絡(luò)模型發(fā)展及應(yīng)用

《 AI加速器架構(gòu)設(shè)計(jì)與實(shí)現(xiàn)》+第一章卷積神經(jīng)網(wǎng)絡(luò)觀后感

一種卷積神經(jīng)網(wǎng)絡(luò)和極限學(xué)習(xí)機(jī)相結(jié)合的人臉識(shí)別方法_余丹

結(jié)合小波變換的LSTM循環(huán)神經(jīng)網(wǎng)絡(luò)的稅收預(yù)測(cè)

卷積神經(jīng)網(wǎng)絡(luò)原理：卷積神經(jīng)網(wǎng)絡(luò)模型和卷積神經(jīng)網(wǎng)絡(luò)算法

卷積神經(jīng)網(wǎng)絡(luò)概述卷積神經(jīng)網(wǎng)絡(luò)的特點(diǎn) cnn卷積神經(jīng)網(wǎng)絡(luò)的優(yōu)點(diǎn)

卷積神經(jīng)網(wǎng)絡(luò)的基本原理卷積神經(jīng)網(wǎng)絡(luò)發(fā)展卷積神經(jīng)網(wǎng)絡(luò)三大特點(diǎn)

卷積神經(jīng)網(wǎng)絡(luò)層級(jí)結(jié)構(gòu) 卷積神經(jīng)網(wǎng)絡(luò)的卷積層講解

卷積神經(jīng)網(wǎng)絡(luò)的介紹什么是卷積神經(jīng)網(wǎng)絡(luò)算法

卷積神經(jīng)網(wǎng)絡(luò)的原理與實(shí)現(xiàn)