0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

機(jī)器人視覺處理的四個(gè)階段戰(zhàn)略

新機(jī)器視覺 ? 來源:新機(jī)器視覺 ? 作者:新機(jī)器視覺 ? 2020-11-27 09:40 ? 次閱讀

第一代機(jī)器人,如第一批消費(fèi)級(jí)機(jī)器人吸塵器,相對(duì)來說比較簡單,自我導(dǎo)航和執(zhí)行任務(wù)的能力有限。這些機(jī)器人通過紅外發(fā)射器等探測障礙物,使用震動(dòng)傳感器檢測碰撞。但是,這些都已成為歷史。

隨著人工智能AI)、機(jī)器學(xué)習(xí)(ML)和計(jì)算機(jī)視覺(CV)等融合技術(shù)的進(jìn)步,現(xiàn)在,機(jī)器人可以看到周圍的環(huán)境,分析動(dòng)態(tài)場景或變化的條件,并做出決定。而硬件創(chuàng)新進(jìn)一步推動(dòng)了這些功能的完善,比如越來越強(qiáng)大的移動(dòng)平臺(tái)、更復(fù)雜的傳感器和高分辨率圖像捕獲。

有了這些資源,開發(fā)者可以專注于開發(fā)更少依賴外部硬件(如GPS)的更自主的智能機(jī)器人,機(jī)器人的工作環(huán)境也得到大大的拓展(如,在室內(nèi)、在弱光下等),并且可以處理不斷變化的環(huán)境和移動(dòng)物體。為零售、汽車、農(nóng)業(yè)、工業(yè)物聯(lián)網(wǎng)IoT)、健康和企業(yè)等領(lǐng)域的新型機(jī)器人應(yīng)用鋪平了道路。

為實(shí)現(xiàn)上述目標(biāo),機(jī)器人開發(fā)者應(yīng)努力克服機(jī)器人視覺三大挑戰(zhàn):

? 確定對(duì)象的方向:不僅要識(shí)別周圍環(huán)境中的對(duì)象,還必須確定它們?cè)?D空間中的方向,以便機(jī)器人與這些對(duì)象交互和/或回避這些對(duì)象。

? 處理移動(dòng)對(duì)象:給定環(huán)境中的對(duì)象可能不是靜態(tài)的。機(jī)器人需要在空間和時(shí)間上檢測、識(shí)別和跟蹤對(duì)象。

? 導(dǎo)航:要使機(jī)器人具有自主性,還需要相應(yīng)的算法,允許其在變化的環(huán)境中進(jìn)行移動(dòng)。

四階段戰(zhàn)略

開發(fā)者可以根據(jù)要求,通過采用四階段策略來克服這些挑戰(zhàn):

1. 預(yù)處理:從現(xiàn)實(shí)世界(如,傳感器和相機(jī))收集數(shù)據(jù)并轉(zhuǎn)換,使數(shù)據(jù)更加方便使用。

2. 特征檢測:從預(yù)處理數(shù)據(jù)中提取諸如角落、邊緣等特征。

3. 對(duì)象檢測和分類:從特征檢測對(duì)象,并且可以根據(jù)已知的特征圖對(duì)對(duì)象進(jìn)行分類。

4. 對(duì)象跟蹤和導(dǎo)航:跟蹤已識(shí)別對(duì)象,包括對(duì)象和在機(jī)器人導(dǎo)航時(shí)改變環(huán)境的視點(diǎn)。

然后,這些階段生成的數(shù)據(jù)可用于控制伺服、制定決策以及執(zhí)行其他高級(jí)機(jī)器人任務(wù)。

聽起來好像工作量很大,事實(shí)上也可能如此,但幸運(yùn)的是,現(xiàn)在有相應(yīng)的框架和硬件,幫助您解決這個(gè)問題。Qualcomm Technologies, Inc.最近發(fā)布了 Qualcomm機(jī)器人RB3平臺(tái)(RB3)(基于QualcommSDA845 SoC(SDA845))及相關(guān)的Qualcomm RoboticsRB3開發(fā)套件。該套件為開發(fā)者提供了移動(dòng)硬件功能和豐富的工具支持,助力您解決上述挑戰(zhàn)。

本系列文章共兩篇,在第一篇中,我們將介紹該策略的前兩個(gè)階段:預(yù)處理和特征檢測,以及如何使用功能豐富的開發(fā)工具包(如Qualcomm Robotics RB3開發(fā)套件。

預(yù)處理

機(jī)器人使用一個(gè)或多個(gè)攝像頭和/或其他傳感器從現(xiàn)實(shí)世界收集數(shù)據(jù)。但是,這些原始數(shù)據(jù)可能不適合于滿足既定目標(biāo)所需的準(zhǔn)確計(jì)算和預(yù)測。此時(shí),可以使用數(shù)字信號(hào)處理(DSP)等方法,“清理”數(shù)據(jù),使其方便使用。比如,可以采用多種方式清理圖像數(shù)據(jù),包括調(diào)整大小、伽馬校正和對(duì)比度增強(qiáng);而傳感器數(shù)據(jù),如來自Qualcomm Robotics RB3開發(fā)套件上的慣性測量單元(IMU)、加速度計(jì)、氣壓計(jì)和/或麥克風(fēng)的傳感器數(shù)據(jù),可以進(jìn)行融合、內(nèi)推和/或過濾。

在處理圖像數(shù)據(jù)時(shí),必須規(guī)劃好收集數(shù)量和速度。Qualcomm Robotics RB3開發(fā)套件支持兩個(gè)(立體)圖像,這意味著系統(tǒng)必須同時(shí)處理兩個(gè)平面。此外,還可以支持16-32萬像素的分辨率和30-60 fps的幀速率。同樣,可以使用Qualcomm SDA845上的高速和低速連接器以及您采用的傳感器類型,以各種頻率和比特率收集傳感器數(shù)據(jù)。

為減少處理這些數(shù)據(jù)的開銷,一般希望使用最低采樣率和分辨率,滿足應(yīng)用程序所需的數(shù)據(jù)量即可。此外,還應(yīng)盡可能將處理流程卸載到合適的處理器。Qualcomm SDA845與專用硬件兼容,包括Qualcomm Hexagon 685 DSP和Qualcomm Spectra 280 ISP,以及更通用的Qualcomm Kryo385 CPU和面向圖形的Qualcomm Adreno 630 GPU。

在API方面,開發(fā)者可以使用Qualcomm計(jì)算機(jī)視覺庫,該庫包含許多用于圖像預(yù)處理的硬件加速API。也可以使用Qualcomm神經(jīng)處理引擎SDK,其中包含圖像預(yù)處理API,用于處理神經(jīng)網(wǎng)絡(luò)中的圖像。另外,還可以選擇使用Qualcomm驍龍異構(gòu)計(jì)算SDK,進(jìn)一步控制計(jì)算操作的執(zhí)行方式。

特征檢測

通過提供干凈的數(shù)據(jù),可以提取功能。對(duì)于可視化數(shù)據(jù),計(jì)算機(jī)視覺開發(fā)者希望的四種常用特性包括:

? 角落:具有局部2D結(jié)構(gòu)的點(diǎn)狀特征

? 邊緣:兩個(gè)區(qū)域之間的一組點(diǎn)

? Blob:感興趣的區(qū)域

? 脊:具有脊點(diǎn)的曲線

這篇維基百科文章提供了有關(guān)這些特性的更多信息,并列出了許多特性檢測器算法以及以檢測的特性類型。下圖顯示了從可視數(shù)據(jù)中檢測到的特性:

特征檢測算法需要大量處理能力,但通常逐個(gè)像素運(yùn)行,因此,很適合在Qualcomm SDA845不同處理器上并行執(zhí)行。開發(fā)者可以使用計(jì)算機(jī)視覺庫中的特性檢測API,其中包括Harris角檢測器、FAST、Hough Transform和其他檢測器,以及基于最大穩(wěn)定極值區(qū)(MSER)的對(duì)象檢測API。

結(jié)論

前兩個(gè)階段為機(jī)器人視覺處理打下了堅(jiān)實(shí)的基礎(chǔ)。預(yù)處理將數(shù)據(jù)轉(zhuǎn)換為可用形式,而特征檢測則是了解數(shù)據(jù)的過程。在以后的文章中,我們將繼續(xù)探討最后兩個(gè)階段:對(duì)象檢測和分類、對(duì)象跟蹤和導(dǎo)航,為機(jī)器人提供導(dǎo)航和與周圍環(huán)境交互所需的數(shù)據(jù)。(來源于Qualcomm)

責(zé)任編輯:xj

原文標(biāo)題:機(jī)器人視覺處理四階段策略

文章出處:【微信公眾號(hào):新機(jī)器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 機(jī)器人
    +關(guān)注

    關(guān)注

    210

    文章

    27883

    瀏覽量

    204793
  • 機(jī)器視覺
    +關(guān)注

    關(guān)注

    161

    文章

    4275

    瀏覽量

    119598
  • CV
    CV
    +關(guān)注

    關(guān)注

    0

    文章

    51

    瀏覽量

    16801

原文標(biāo)題:機(jī)器人視覺處理四階段策略

文章出處:【微信號(hào):vision263com,微信公眾號(hào):新機(jī)器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    工業(yè)機(jī)器人視覺技術(shù)的應(yīng)用分為哪幾種?

    工業(yè)機(jī)器人視覺技術(shù)的應(yīng)用非常廣泛,涉及到許多不同的領(lǐng)域和場景。以下是一些主要的應(yīng)用領(lǐng)域和相關(guān)技術(shù): 物體識(shí)別與定位 物體識(shí)別與定位是工業(yè)機(jī)器人視覺技術(shù)的基礎(chǔ)應(yīng)用之一。通過使用攝像頭和其
    的頭像 發(fā)表于 07-09 09:38 ?392次閱讀

    機(jī)器人視覺與計(jì)算機(jī)視覺的區(qū)別與聯(lián)系

    機(jī)器人視覺與計(jì)算機(jī)視覺是兩個(gè)密切相關(guān)但又有所區(qū)別的領(lǐng)域。 1. 引言 在當(dāng)今科技迅猛發(fā)展的時(shí)代,機(jī)器人和計(jì)算機(jī)
    的頭像 發(fā)表于 07-09 09:27 ?341次閱讀

    機(jī)器人視覺技術(shù)中圖像分割方法有哪些

    機(jī)器人視覺技術(shù)是人工智能領(lǐng)域的一個(gè)重要分支,它涉及到圖像處理、模式識(shí)別、機(jī)器學(xué)習(xí)等多個(gè)學(xué)科。圖像分割是機(jī)
    的頭像 發(fā)表于 07-04 11:34 ?406次閱讀

    機(jī)器人視覺的應(yīng)用范圍

    機(jī)器人視覺是一種將計(jì)算機(jī)視覺技術(shù)應(yīng)用于機(jī)器人領(lǐng)域的技術(shù),它使得機(jī)器人能夠感知和理解周圍環(huán)境,實(shí)現(xiàn)自主決策和執(zhí)行任務(wù)。隨著人工智能、
    的頭像 發(fā)表于 07-04 11:33 ?304次閱讀

    機(jī)器人視覺的結(jié)構(gòu)及工作原理

    機(jī)器人視覺是一種利用計(jì)算機(jī)視覺技術(shù)實(shí)現(xiàn)機(jī)器人對(duì)環(huán)境的感知和理解的技術(shù)。它涉及到圖像采集、圖像處理、特征提取、目標(biāo)識(shí)別、場景理解等多個(gè)環(huán)節(jié)。
    的頭像 發(fā)表于 07-04 11:27 ?632次閱讀

    機(jī)器人視覺的作用是什么

    的應(yīng)用越來越廣泛,成為推動(dòng)機(jī)器人技術(shù)發(fā)展的重要力量。 二、機(jī)器人視覺的基本原理 視覺感知:機(jī)器人視覺
    的頭像 發(fā)表于 07-04 11:24 ?378次閱讀

    機(jī)器人視覺可以分為哪三個(gè)部分?

    機(jī)器人視覺機(jī)器人技術(shù)中的一個(gè)重要分支,它涉及到圖像處理、計(jì)算機(jī)視覺、
    的頭像 發(fā)表于 07-04 11:17 ?397次閱讀

    基于FPGA EtherCAT的六自由度機(jī)器人視覺伺服控制設(shè)計(jì)

    概述 中國制造 2025 是中國政府實(shí)施制造強(qiáng)國戰(zhàn)略的第一個(gè)十年行動(dòng)綱領(lǐng),是全面提升中國制造業(yè)發(fā)展質(zhì)量和水平的重大戰(zhàn)略部署,其中明確指出了圍繞工業(yè)機(jī)器人創(chuàng)新技術(shù)的重要地位。目
    發(fā)表于 05-29 16:17

    視覺機(jī)器人焊接的研究現(xiàn)狀

    視覺機(jī)器人焊接技術(shù)是將計(jì)算機(jī)視覺機(jī)器人技術(shù)相結(jié)合,實(shí)現(xiàn)自動(dòng)焊接過程中的實(shí)時(shí)檢測、跟蹤和控制。這一領(lǐng)域的研究一直處于不斷發(fā)展之中,吸引了眾多研究人員和工程師的關(guān)注。本文將就
    的頭像 發(fā)表于 04-02 15:34 ?391次閱讀
    <b class='flag-5'>視覺</b><b class='flag-5'>機(jī)器人</b>焊接的研究現(xiàn)狀

    BUCK電路工作原理四個(gè)階段

    BUCK電路工作原理四個(gè)階段? BUCK電路是一種常用的降壓轉(zhuǎn)換器,廣泛應(yīng)用于電源管理領(lǐng)域。其工作原理可以分為四個(gè)階段:導(dǎo)通、關(guān)斷、自阻抗、反饋調(diào)節(jié)。 1. 導(dǎo)通
    的頭像 發(fā)表于 01-31 16:08 ?795次閱讀

    SMT絲印技術(shù)的歷史發(fā)展的四個(gè)階段,你知道嗎?

    SMT絲印技術(shù)的歷史發(fā)展的四個(gè)階段,你知道嗎?
    的頭像 發(fā)表于 12-27 10:15 ?593次閱讀

    機(jī)器視覺大核心功能

    通過計(jì)算機(jī)軟件進(jìn)行處理和分析。機(jī)器視覺在工業(yè)、醫(yī)療、農(nóng)業(yè)、交通、安防等領(lǐng)域都有廣泛的應(yīng)用。 機(jī)器視覺的核心功能可以歸納為
    的頭像 發(fā)表于 12-25 11:15 ?853次閱讀

    選對(duì)機(jī)器人集成商四個(gè)關(guān)鍵

    與具有專業(yè)知識(shí)和經(jīng)驗(yàn)豐富的機(jī)器人集成商合作,同時(shí)采用高性能的機(jī)器人和先進(jìn)的外圍設(shè)備,有助于制造企業(yè)更高效地實(shí)現(xiàn)機(jī)器人自動(dòng)化。
    的頭像 發(fā)表于 12-20 11:18 ?771次閱讀

    中國人形機(jī)器人產(chǎn)業(yè)拆解分析

    人形機(jī)器人全球?qū)@暾?qǐng)主要經(jīng)歷了四個(gè)發(fā)展階段,其中,21世紀(jì)是人形機(jī)器人高集成和高動(dòng)態(tài)的發(fā)展階段,國際范圍內(nèi)眾多科技公司在這一
    發(fā)表于 12-12 09:47 ?266次閱讀

    四個(gè)腿的電感是什么?有什么作用?

    機(jī)器人技術(shù)等。 基礎(chǔ)原理 四個(gè)腿的電感器由四個(gè)電極組成。兩個(gè)電極(或兩條腿)是對(duì)稱的,并且有一定的距離。另外兩個(gè)電極也是對(duì)稱的,并且與前兩
    的頭像 發(fā)表于 10-31 14:43 ?1278次閱讀