0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

讓機(jī)器人懂得人類“常識”,3D語義地圖能做到嗎?

雙目立體視覺 ? 來源:雙目立體視覺 ? 作者:雙目立體視覺 ? 2023-08-11 11:20 ? 次閱讀

機(jī)器人需要一張保姆級地圖。

隨著機(jī)器人的智能化技術(shù)不斷迭代,對于復(fù)雜的行為決策、人機(jī)交互等任務(wù)僅感知環(huán)境的空間幾何信息已無法滿足要求,它需要讓機(jī)器人能夠像人一樣,懂得環(huán)境中的物體類別及其位置,即環(huán)境的語義信息。以掃地機(jī)器人為例,一個(gè)清掃餐桌底部的任務(wù)便要求它需要知道目標(biāo)的類別和位置。然而目前主流的傳統(tǒng)2D柵格地圖、拓?fù)涞貓D雖然能夠描述環(huán)境中存在的障礙物幾何特征及其環(huán)境結(jié)構(gòu)信息,但卻缺乏機(jī)器人用于理解環(huán)境、人機(jī)/物機(jī)交互等業(yè)務(wù)邏輯的高層次語義信息,相反,3D語義地圖不僅包含物體及環(huán)境的結(jié)構(gòu)信息,還有物體類別、功能屬性等“常識”性信息,可以說是機(jī)器人的保姆級地圖。

從技術(shù)角度而言,3D語義地圖的地圖模型是針對真實(shí)場景的三維環(huán)境重構(gòu),包含區(qū)域性場景信息及場景中每個(gè)獨(dú)立物體的屬性、空間中的三維模型、位姿信息等,使機(jī)器人在語義層次上理解環(huán)境信息,模仿人類大腦對環(huán)境理解的方式,從而為實(shí)現(xiàn)更高層次的智能化操作提供信息支持。

如何構(gòu)建3D語義地圖?

要構(gòu)建3D語義地圖,前提是需要提取出你所需要的物體特征,并進(jìn)行語義切割。INDEMIND在實(shí)現(xiàn)構(gòu)建3D語義地圖中,采用了立體視覺技術(shù)路線,通過對雙目視覺傳感器獲取到3D視覺點(diǎn)云信息進(jìn)行點(diǎn)云聚類,并結(jié)合邊緣端的嵌入式深度學(xué)習(xí)和VSLAM算法,輸出個(gè)體性物體語義和區(qū)域性場景語義,從而實(shí)現(xiàn)3D語義地圖構(gòu)建。

在真實(shí)場景中,無論是家庭、公司還是超市,大多擁有著3個(gè)及3個(gè)以上的細(xì)分場景,且這些場景大多有著相似性,當(dāng)機(jī)器人收到指定房間作業(yè)任務(wù)后如何快速準(zhǔn)確地理解房間的功能屬性,找到對應(yīng)房間,并能根據(jù)不同房間的功能屬性進(jìn)行個(gè)性化作業(yè)還需要極高的場景理解準(zhǔn)確度。

因此,INDEMIND是根據(jù)輸出的區(qū)域性場景語義和個(gè)體性物體語義二者融合的方式實(shí)現(xiàn)場景理解。首先,根據(jù)獲取到的區(qū)域性場景語義信息,進(jìn)行整體特征識別;其次,會(huì)根據(jù)個(gè)體性物體語義識別,對場景中一系列獨(dú)立個(gè)體信息進(jìn)行識別,并作為場景特征標(biāo)志,最終通過二相疊加判斷,實(shí)現(xiàn)準(zhǔn)確穩(wěn)定地場景理解。

在實(shí)際表現(xiàn)中,應(yīng)用3D語義地圖的機(jī)器人,結(jié)合INDEMIND VSLAM算法和智能決策引擎,在AI識別、智能避障、指令智能作業(yè)、人機(jī)/物機(jī)交互等方面均有優(yōu)異表現(xiàn)。

在AI識別和避障方面,基于3D語義地圖,能夠快速提取環(huán)境中各類圖像特征,結(jié)合深度學(xué)習(xí)可立體識別行人、動(dòng)物、固定/移動(dòng)物體等個(gè)體性障礙物,以及樓梯、自動(dòng)扶梯等危險(xiǎn)場景,避免危險(xiǎn)情況發(fā)生,這種結(jié)合物體3D信息的識別和避障效果的穩(wěn)定性、準(zhǔn)確率都得到顯著提升。同時(shí),通過識別到與顯示匹配的障礙物3D信息,機(jī)器人還可做出類似人類規(guī)避動(dòng)作的精細(xì)化操作,能夠讓機(jī)器人有預(yù)判、有策略的實(shí)現(xiàn)主動(dòng)避障。

在交互和智能作業(yè)方面,3D語義地圖通過對場景中獨(dú)立個(gè)體、房間信息做語義識別及物體分割,機(jī)器人懂得人類“常識”后,便能實(shí)現(xiàn)高層次的交互邏輯,配合INDEMIND自研的自然語言交互技術(shù),可通過語音、手勢、動(dòng)作等指令,命令機(jī)器人進(jìn)行安全、搜尋、跟隨、自主尋路、定向清掃等多種智能作業(yè)邏輯。以定向清掃為例,發(fā)布語音命令:“清掃一下臥室”可被識別為針對地圖上識別到的臥室區(qū)域進(jìn)行一次規(guī)劃清掃,告別粗糙的交互體驗(yàn)。

目前,3D語義地圖技術(shù)已應(yīng)用到INDMEIND推出的家用機(jī)器人導(dǎo)航方案「家用機(jī)器人AI Kit」和商用機(jī)器人導(dǎo)航方案「商用機(jī)器人AI Kit」中,兩種方案的市場表現(xiàn)均得到了客戶的廣泛認(rèn)可。

值得一提的是,兩種方案由于采用視覺技術(shù)路線,在成本方面相對于競品均有著明顯優(yōu)勢。「家用機(jī)器人AI Kit」在實(shí)現(xiàn)同等水平的技術(shù)效果的同時(shí),成本只有激光雷達(dá)融合方案的1/3,且激光視覺融合方案雖然也能獲取到場景中的語義信息,但受限于傳感器限制,事實(shí)上只能識別到物體的二維信息,無法構(gòu)建3D語義地圖?!干逃脵C(jī)器人AI Kit」相比激光雷達(dá)方案,成本下降了60-80%,機(jī)器人開發(fā)成本最低可以下探到2千元以內(nèi),包含導(dǎo)航和電池的完整底盤成本則可以下探到5千元以內(nèi),顯著降低機(jī)器人的開發(fā)成本和周期。

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 機(jī)器人
    +關(guān)注

    關(guān)注

    210

    文章

    27838

    瀏覽量

    204584
  • 智能
    +關(guān)注

    關(guān)注

    8

    文章

    1693

    瀏覽量

    117242
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    28876

    瀏覽量

    266218
  • VSLAM
    +關(guān)注

    關(guān)注

    0

    文章

    23

    瀏覽量

    4283
收藏 人收藏

    評論

    相關(guān)推薦

    中國傳動(dòng)網(wǎng):搭載3D傳感器 iRobot將推智能機(jī)器人

    Rooma系列掃地機(jī)器人在清潔領(lǐng)域有了很長時(shí)間的發(fā)展,不過他們還不滿足于此。近日,iRobot公司表示公司將在機(jī)器人上安裝3D傳感器,為用戶提供更加智能的使用體驗(yàn)。通過3D傳感器,
    發(fā)表于 04-25 15:03

    中國傳動(dòng)網(wǎng):搭載3D傳感器 iRobot將推智能機(jī)器人

    Rooma系列掃地機(jī)器人在清潔領(lǐng)域有了很長時(shí)間的發(fā)展,不過他們還不滿足于此。近日,iRobot公司表示公司將在機(jī)器人上安裝3D傳感器,為用戶提供更加智能的使用體驗(yàn)。通過3D傳感器,
    發(fā)表于 04-25 15:05

    【Aworks申請】家庭服務(wù)機(jī)器人

    筆記本電腦。項(xiàng)目描述:1 物體識別技術(shù)機(jī)器人需要識別家庭環(huán)境,如家具、電器和玩具等。2 人體識別技術(shù)通過人臉檢測和識別技術(shù)識別主人和陌生人。識別人的動(dòng)作和表情等。3 動(dòng)態(tài)不確定環(huán)境下的自定位、地圖創(chuàng)建與導(dǎo)航
    發(fā)表于 07-19 23:33

    不完美的伴侶機(jī)器人?

    機(jī)器人,用來研究兒童社交發(fā)展。第三個(gè)機(jī)器人是一個(gè)3D打印的人形機(jī)器人,名叫Marc(多驅(qū)動(dòng)機(jī)器人伴侶)。  研究者為三個(gè)
    發(fā)表于 12-28 14:42

    震驚!模塊細(xì)胞機(jī)器人!最接近人類機(jī)器人!

    模塊細(xì)胞機(jī)器人!最接近人類機(jī)器人!
    發(fā)表于 01-22 17:55

    機(jī)器人將取代人類,你覺得吶?

    們?nèi)鄙倭烁星?、思考和生命。但是如果哪天互?lián)網(wǎng)機(jī)器人有了“思維”呢?未知就代表一切都有發(fā)生的可能,我們也無法預(yù)測如果機(jī)器人通過互聯(lián)網(wǎng)信息的集中會(huì)得出人類是好還是壞的結(jié)果?所以壇友們怎么
    發(fā)表于 03-09 18:38

    語義機(jī)器人

    客服機(jī)器人系統(tǒng)、智能硬件和機(jī)器人的對話系統(tǒng)建設(shè),能讓人機(jī)對話的過程變得更加自然流暢;另外還可以接入類似幼兒教育、聽廣播、訂機(jī)票等外部服務(wù),功能可以無限擴(kuò)展。
    發(fā)表于 03-10 16:52

    物聯(lián)網(wǎng)、AR、3D打印、機(jī)器人未來將改變我們的生活?

    的更加實(shí)用!物聯(lián)網(wǎng)、增強(qiáng)現(xiàn)實(shí)(AR)、3D打印和機(jī)器人技術(shù),曾經(jīng)只能在科幻電影里看到的黑科技,正在逐漸走進(jìn)我們的生活。物聯(lián)網(wǎng)“物聯(lián)網(wǎng)”即是萬物互聯(lián),是指通過互聯(lián)網(wǎng)連接孤立人與設(shè)備,他們實(shí)現(xiàn)交流!一個(gè)
    發(fā)表于 10-19 09:18

    人類機(jī)器人有感情產(chǎn)生嗎?

    `  之前看到周潤發(fā)的一部電影里面的一個(gè)機(jī)器人,我對機(jī)器人有了新的看法。里面的那個(gè)機(jī)器人表情豐富、機(jī)智幽默?! ‖F(xiàn)在人們疑惑的是與人工智
    發(fā)表于 11-10 10:18

    Voxel 3D 飛行時(shí)間傳感器機(jī)器人視覺參考設(shè)計(jì)

    的性能,此外還探討了 3D 傳感器(積分時(shí)間、飽和度)、信號處理(濾波)和外部紅外 (IR) 輻射源對測量的影響。憑借 3D TOF 解決方案的距離測量準(zhǔn)確性,掃地機(jī)器人能夠檢測和識別物體并構(gòu)建房間
    發(fā)表于 10-11 15:37

    怎么構(gòu)建一張滿足機(jī)器人導(dǎo)航需求的地圖?

    定位導(dǎo)航技術(shù)使機(jī)器人即使在無人操控的情況下,也可實(shí)現(xiàn)自主行走、避障及順利到達(dá)目的地,機(jī)器人人類繪制地圖一樣,在描述環(huán)境及認(rèn)識環(huán)境的過程中都需要依靠
    發(fā)表于 08-18 06:47

    未來的機(jī)器人3D視覺系統(tǒng)將會(huì)發(fā)生什么樣的變化?

    視覺系統(tǒng)的發(fā)展趨勢怎么樣?3D視覺系統(tǒng)應(yīng)用在哪些方面?未來的機(jī)器人3D視覺系統(tǒng)將會(huì)發(fā)生什么樣的變化?
    發(fā)表于 05-11 06:40

    基于Arduino的3D打印2輪機(jī)器人

    描述AR.LO - Arduino 3D 打印機(jī)器人AR.LO 是一款基于 Arduino 的 3D 打印 2 輪機(jī)器人。它具有:OLED 顯示屏、超聲波傳感器、藍(lán)牙模塊和 2 個(gè)改進(jìn)
    發(fā)表于 08-12 07:55

    3D打印構(gòu)建“折紙”機(jī)器人抓手

    麻省理工使用3D打印來構(gòu)建“折紙”機(jī)器人抓手
    的頭像 發(fā)表于 03-20 14:16 ?5033次閱讀

    機(jī)器人如何構(gòu)建3D語義地圖?

    業(yè)務(wù)邏輯的高層次語義信息,相反,3D語義地圖不僅包含物體及環(huán)境的結(jié)構(gòu)信息,還有物體類別、功能屬性等“常識”性信息,可以說是
    發(fā)表于 08-11 11:01 ?459次閱讀