0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

奧比中光助力機器人客戶快速實現(xiàn)創(chuàng)新應(yīng)用開發(fā)與量產(chǎn)制造

奧比中光 ? 來源:奧比中光 ? 2023-12-13 09:07 ? 次閱讀

是時候給大模型造個身體了。

近期,奧比中光研發(fā)團隊結(jié)合機械臂與大模型,利用語音、語言、視覺-語言大模型,輔以Orbbec Gemini 2系列深度相機的數(shù)據(jù)輸入,打造出一個能夠理解、執(zhí)行語音任務(wù)的機械臂。

該項目以斯坦福大學(xué)李飛飛教授團隊打造的機器人智能體為基礎(chǔ),通過解決泛化、觀測、控制等一系列工程化難題,將基于多模態(tài)大模型的機械臂從仿真環(huán)境落地到現(xiàn)實世界,拓展智能機械臂應(yīng)用潛能。

融合多種大模型能力

讓機械臂理解、執(zhí)行語音指令

去年以來,各類大模型的涌現(xiàn)引發(fā)了機器人產(chǎn)業(yè)新一輪發(fā)展浪潮。盡管“大模型+機器人”還處于早期技術(shù)探索階段,但隨著二者深入融合,機器人有望具備更智能的“大腦”,配合更強大的“眼睛”與“身體”,實現(xiàn)向具身智能的進(jìn)化。

奧比中光最新打造的大模型機械臂,可以通過語音Prompts作為輸入,利用多種大模型的理解能力和視覺感知能力,生成空間語義信息,讓機械臂理解、執(zhí)行動作。

首先,機械臂可借助語音大模型,識別任務(wù)下發(fā)者的語音指令;同時,通過兩臺Orbbec Gemini 2雙目結(jié)構(gòu)光相機,獲取高質(zhì)量環(huán)境RGB和Depth數(shù)據(jù);再利用SAM、CLIP等視覺-語言大模型,理解場景信息,并進(jìn)行實時碰撞檢測,最終執(zhí)行任務(wù)。

基于這一原理,奧比中光可以讓機械臂完成一系列指令,比如:

請記住當(dāng)前的狀態(tài)

把紅色的方塊放到黃色的框中

把綠色的方塊放到白色的框里面

把藍(lán)色的方塊逆時針旋轉(zhuǎn)30°

將藍(lán)色方塊朝著綠色方塊的方向移動10cm

把藍(lán)色方塊放到綠色的方塊上面

請恢復(fù)最開始的狀態(tài)

請把所有的方塊放到黃色的框中

目前,該項目在1.0階段打通了多模態(tài)大模型在機械臂上的應(yīng)用部署baseline。奧比中光正在進(jìn)一步優(yōu)化多模態(tài)指令理解、多傳感器融合感知、機械臂軌跡規(guī)劃控制、末端抓取控制等方面,未來將推出大模型機器人控制系統(tǒng),讓機器人更加智能、靈活,適應(yīng)更加復(fù)雜的操作場景。

克服泛化、觀測、控制難題

從仿真變?yōu)楝F(xiàn)實

目前,國內(nèi)外眾多針對機器人智能體的研究多在仿真環(huán)境中完成。而從虛擬仿真到真實世界,還需要克服一系列工程化落地難題。比如,在仿真環(huán)境中,相機基于理想的成像模型,可以不受成像畸變、環(huán)境光照等影響,這就對智能體在真實場景中的泛化能力提出了挑戰(zhàn)。

奧比中光的研發(fā)團隊基于預(yù)訓(xùn)練的多模態(tài)機械臂模型,克服了泛化、觀測、控制等一系列落地難題:

為實現(xiàn)快速準(zhǔn)確的語音輸入與理解,引入語音預(yù)訓(xùn)練大模型,使得機械臂靈敏響應(yīng)語音指令。

為確保機械臂在真實世界中具備足夠的泛化能力,采用視覺-語言大模型,使機械臂理解適應(yīng)復(fù)雜場景,在多樣化的環(huán)境中穩(wěn)健執(zhí)行任務(wù)。

為處理預(yù)訓(xùn)練模型的理想相機成像問題,設(shè)計全新標(biāo)定方案,優(yōu)化相機自動曝光(AE)策略,解決受環(huán)境光、成像畸變、透視形變等因素帶來的挑戰(zhàn),使機械臂擁有更強的魯棒性。

為提高機械臂在復(fù)雜環(huán)境中的安全性,引入深度相機碰撞檢測和抓取修正,優(yōu)化機械臂控制,提高機械臂抓取場景的性能、精度和適應(yīng)性。

基于關(guān)鍵技術(shù)的引入與創(chuàng)新,奧比中光成功地克服了多模態(tài)機械臂在多個交叉領(lǐng)域的難題,打通工程化應(yīng)用落地的“最后一公里”。

在機器人視覺領(lǐng)域,奧比中光擁有超過8年的行業(yè)落地經(jīng)驗,服務(wù)超過100家機器人產(chǎn)業(yè)企業(yè)。通過多年合作,奧比中光在機器人3D傳感器、激光雷達(dá)、模型算法等方面積累了豐富的經(jīng)驗,助力機器人客戶快速實現(xiàn)創(chuàng)新應(yīng)用開發(fā)與量產(chǎn)制造。

布局多模態(tài)視覺大模型

升維機器人應(yīng)用潛力

融合多種大模型能力的機械臂,可以應(yīng)用在哪些場景?

隨著機器人的“眼睛”(視覺傳感器)、“大腦”(大模型)、“身體”(本體)不斷發(fā)展進(jìn)化,智能機器人及機械臂有望在工業(yè)制造、柔性物流、商用服務(wù)等場景中率先落地。

例如,在自動化工廠場景,基于多模態(tài)大模型的機器臂可以結(jié)合無人小車,進(jìn)行智能分揀、搬運;在家用服務(wù)機器人場景,人們可以通過簡單的自然語言指令,讓機器人幫忙倒水、取快遞。

當(dāng)前,面向機器人產(chǎn)業(yè),奧比中光可提供單目結(jié)構(gòu)光、雙目結(jié)構(gòu)光、iToF、激光雷達(dá)、dToF等全技術(shù)路線3D視覺傳感器,并提供多傳感器融合支持。同時,針對AI大模型、具身智能機器人等科技發(fā)展趨勢,奧比中光正在致力于搭建機器人及AI視覺中臺,通過多模態(tài)視覺大模型及智能算法的研發(fā),結(jié)合機器人視覺傳感器,將形成自主移動定位導(dǎo)航和避障的完整產(chǎn)品方案,為全產(chǎn)業(yè)下游客戶提供全方位能力平臺及系列化產(chǎn)品方案,迎接智能機器人時代。

審核編輯:彭菁

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 機器人
    +關(guān)注

    關(guān)注

    210

    文章

    27838

    瀏覽量

    204589
  • 3D傳感器
    +關(guān)注

    關(guān)注

    4

    文章

    113

    瀏覽量

    26548
  • 奧比中光
    +關(guān)注

    關(guān)注

    1

    文章

    134

    瀏覽量

    8463
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    2135

    瀏覽量

    1978

原文標(biāo)題:從仿真變成現(xiàn)實,奧比中光大模型機械臂1.0來了!

文章出處:【微信號:orbbec,微信公眾號:奧比中光】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    與英偉達(dá)深化機器人場景合作

    光在最新互動平臺動態(tài)宣布,公司與全球領(lǐng)先的圖形處理器(GPU)制造商英偉達(dá)在機器人領(lǐng)域展
    的頭像 發(fā)表于 08-01 17:17 ?813次閱讀

    連獲兩項機器人行業(yè)殊榮

    機器人技術(shù)正以前所未有的速度重塑智能產(chǎn)業(yè)格局。近期,憑借在機器人與AI視覺技術(shù)
    的頭像 發(fā)表于 07-19 16:49 ?529次閱讀

    AMR機器人OEM項目首批成功下線交付

    近日,光在東莞自營工廠舉辦了AMR機器人OEM項目首批下線交付儀式。此次交付的AMR機器人
    的頭像 發(fā)表于 07-01 10:28 ?480次閱讀

    OpenCV攜3D相機亮相CVPR 2024

    機器學(xué)習(xí)軟件庫,提供豐富的圖像處理和計算機視覺算法。與OpenCV的深入合作,使得復(fù)雜的3D感知項目
    的頭像 發(fā)表于 06-21 09:38 ?370次閱讀

    聯(lián)合英偉達(dá),實現(xiàn)更高效的自主機器人導(dǎo)航

    5月6日-9日,光在美國芝加哥舉辦的北美最大自動化技術(shù)展Automate 2024亮相,帶來了新一代全場景雙目3D相機——Gemini 330系列,獲得眾多專業(yè)機器人
    的頭像 發(fā)表于 05-11 09:18 ?594次閱讀

    重磅| 全新雙目系列3D相機,搭載自研芯片,為智能機器人而生

    ? 4月29日,正式發(fā)布全新Gemini 330系列雙目3D相機,首發(fā)產(chǎn)品包括Gemini 335、Gemini 335L兩款通用型高性能雙目3D相機。新品首次搭載
    發(fā)表于 04-30 18:00 ?341次閱讀
    重磅| <b class='flag-5'>奧</b><b class='flag-5'>比</b><b class='flag-5'>中</b><b class='flag-5'>光</b>全新雙目系列3D相機,搭載自研芯片,為智能<b class='flag-5'>機器人</b>而生

    政企攜手走進(jìn),共話商業(yè)服務(wù)機器人新場景新增長

    4月26日,由深圳市工業(yè)和信息化局指導(dǎo)、深圳市機器人協(xié)會主辦的深圳市“機器人+”應(yīng)用推廣活動之商業(yè)社區(qū)專場走進(jìn)科技大廈。
    的頭像 發(fā)表于 04-29 10:25 ?592次閱讀
    政企攜手走進(jìn)<b class='flag-5'>奧</b><b class='flag-5'>比</b><b class='flag-5'>中</b><b class='flag-5'>光</b>,共話商業(yè)服務(wù)<b class='flag-5'>機器人</b>新場景新增長

    攜手新加坡LionsBot,讓智能清潔機器人落地超過30個國家

    近年來,隨著AI 3D視覺技術(shù)飛速發(fā)展,各類創(chuàng)新型自主移動機器人不斷涌現(xiàn)。行業(yè)領(lǐng)先的機器人視覺與AI視覺科技公司
    的頭像 發(fā)表于 04-16 09:32 ?465次閱讀

    迎來英特爾、微軟3D相機業(yè)務(wù)重要成員

    成員、機器人及計算平臺專家Brad Suessmith與Karthick Kandasamy分別出任
    的頭像 發(fā)表于 03-26 09:37 ?344次閱讀

    3D相機及方案亮相,攜手NVIDIA探索機器人應(yīng)用革新

    3月18日-21日,作為英偉達(dá)NPN合作伙伴亮相NVIDIA GTC 2024 AI開發(fā)者大會,在美國加州圣何塞會議中心帶來基于
    的頭像 發(fā)表于 03-22 09:37 ?259次閱讀

    3D相機及方案亮相,攜手NVIDIA探索機器人應(yīng)用革新

    3月18日-22日,作為英偉達(dá)NPN合作伙伴亮相NVIDIA GTC 2024 AI開發(fā)者大會,在美國加州圣何塞會議中心帶來基于
    的頭像 發(fā)表于 03-19 17:20 ?566次閱讀

    光榮獲機器人傳感器創(chuàng)新應(yīng)用獎

    12月8日,第四屆中國機器人行業(yè)年會在浙江湖州舉辦。光在會上榮獲Leaderobot“2023年度機器人傳感器
    的頭像 發(fā)表于 12-14 09:32 ?602次閱讀

    助力醫(yī)療健康機器人客戶便捷選型

    、醫(yī)療康復(fù)、醫(yī)療服務(wù)、醫(yī)療檢測等領(lǐng)域的產(chǎn)業(yè)應(yīng)用,通過機器人視覺產(chǎn)業(yè)技術(shù)臺賦能,與產(chǎn)業(yè)鏈上下游企業(yè)共謀發(fā)展。 微軟官方推薦產(chǎn)品 助力醫(yī)療健康機器人
    的頭像 發(fā)表于 11-10 09:26 ?1510次閱讀

    3D相機矩陣助力更強機器人開發(fā)

    近日,將視覺生態(tài)產(chǎn)品矩陣集成到新版本NVIDIA Isaac Sim平臺,助力全球超過百萬名機器
    的頭像 發(fā)表于 10-24 11:38 ?748次閱讀

    機器人如何助力智能制造發(fā)展?

    9月25日,2023浦江創(chuàng)新論壇——機器人創(chuàng)新科技論壇在上海閔行區(qū)“大零號灣”舉行,論壇旨在為機器人交叉學(xué)科發(fā)展的創(chuàng)新路徑
    的頭像 發(fā)表于 09-26 17:42 ?818次閱讀