0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

利用人工智能和機(jī)器人技術(shù)實(shí)現(xiàn)復(fù)雜的自動(dòng)化任務(wù)!

大象機(jī)器人科技 ? 來(lái)源:大象機(jī)器人科技 ? 作者:大象機(jī)器人科技 ? 2024-01-08 10:44 ? 次閱讀

這篇mylangrobot項(xiàng)目由neka-nat創(chuàng)建,本文已獲得作者Shirokuma授權(quán)進(jìn)行編輯和轉(zhuǎn)載。

https://twitter.com/neka_nat

wKgaomWbXc-AfSn4AAItgQIQsyI619.png

GitHub-mylangrobot :GitHub - neka-nat/mylangrobot: Language instructions to mycobot using GPT-4V

引言
本項(xiàng)目創(chuàng)建了一個(gè)使用GPT-4V和myCobot的一個(gè)演示,演示機(jī)械臂簡(jiǎn)單得到拾取操作,這個(gè)演示使用了一個(gè)名叫SoM(物體檢測(cè)對(duì)象)的方法,通過(guò)自然語(yǔ)言生成機(jī)器人動(dòng)作。通俗點(diǎn)換一句話來(lái)說(shuō)就是,機(jī)器接受自然語(yǔ)言,去尋找目標(biāo)然后讓機(jī)械臂進(jìn)行抓取的一個(gè)案例。

本項(xiàng)目的亮點(diǎn)主要是GPT-4V的圖像處理和SoM物體檢測(cè)算法相結(jié)合,通過(guò)自然語(yǔ)言和機(jī)器交互實(shí)現(xiàn)機(jī)械臂運(yùn)動(dòng)。

軟件
SoM
Set of Mark(SoM)是一種用于增強(qiáng)大型語(yǔ)言模型的視覺(jué)理解能力。圖像經(jīng)過(guò)SoM處理之后能夠在圖像上添加一系列的標(biāo)記,這些標(biāo)記能夠被語(yǔ)言類模型識(shí)別和處理。這些標(biāo)記有助于模型更準(zhǔn)確的識(shí)別和理解圖像中的物體和內(nèi)容。

wKgZomWbXeOAGegVABI6AYnJIT4306.png

這使得語(yǔ)言模型能夠針對(duì)圖像中的元素進(jìn)行更精準(zhǔn)的分析和描述,從而提高其在視覺(jué)任務(wù)上的表現(xiàn)。

GPT-4V
我們常聊的GPT是一個(gè)大預(yù)言模型,我們可以跟它進(jìn)行對(duì)話聊天。在迭代新的版本的GPT-4V是一個(gè)大模型多模態(tài)語(yǔ)言模型,它不單單能處理文本信息,現(xiàn)在還能夠處理圖像信息。能夠?qū)D像理解,圖像生成,圖像描述的功能,這樣大模型結(jié)合GPT-4的強(qiáng)大自然語(yǔ)言處理能力和現(xiàn)金的圖像分析技術(shù),可以提供更高效和更準(zhǔn)確的視覺(jué)和語(yǔ)言綜合能力。

下面是OpenAI 提供的例子

簡(jiǎn)要介紹:將一個(gè)視頻提供給GPT4,通過(guò)GPT-4V對(duì)圖像的處理,生成對(duì)視頻講解的內(nèi)容的過(guò)程。原文鏈接:Processing and narrating a video with GPT's visual capabilities and the TTS API | OpenAI Cookbook

User:
"These are frames from a video that I want to upload. Generate a compelling description that I can upload along with the video."
wKgaomWbXgWAGZeSAArtx0dAsRs169.png


視頻中某一幀的圖像

#GPT-4V對(duì)圖像的描述處理
GPT4:
"

審核編輯 黃宇
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 機(jī)器人
    +關(guān)注

    關(guān)注

    210

    文章

    27855

    瀏覽量

    204708
  • 人工智能
    +關(guān)注

    關(guān)注

    1787

    文章

    46079

    瀏覽量

    235224
  • GPT
    GPT
    +關(guān)注

    關(guān)注

    0

    文章

    347

    瀏覽量

    15182
  • 機(jī)械臂
    +關(guān)注

    關(guān)注

    12

    文章

    502

    瀏覽量

    24309
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    報(bào)名開啟!深圳(國(guó)際)通用人工智能大會(huì)將啟幕,國(guó)內(nèi)外大咖齊聚話AI

    呈現(xiàn)、產(chǎn)業(yè)展覽、技術(shù)交流、學(xué)術(shù)論壇于一體的世界級(jí)人工智能合作交流平臺(tái)。本次大會(huì)暨博覽會(huì)由工業(yè)和信息部政府采購(gòu)中心、廣東省工商聯(lián)、前海合作區(qū)管理局、深圳市工信局等單位指導(dǎo),深圳市人工智能
    發(fā)表于 08-22 15:00

    英偉達(dá)利用人工智能和Omniverse加速人形機(jī)器人開發(fā)

    8月6日,英偉達(dá)揭曉了一項(xiàng)創(chuàng)新工作流程,該流程深度融合了人工智能技術(shù)與其Omniverse平臺(tái),旨在為人形機(jī)器人的研發(fā)按下加速鍵。通過(guò)巧妙結(jié)合蘋果Vision Pro的先進(jìn)功能與英偉達(dá)的人工智能
    的頭像 發(fā)表于 08-06 17:29 ?578次閱讀

    FPGA在人工智能中的應(yīng)用有哪些?

    以承擔(dān)機(jī)器人路徑規(guī)劃、環(huán)境感知、運(yùn)動(dòng)控制等任務(wù),結(jié)合外部傳感器的反饋信息,實(shí)現(xiàn)高效、準(zhǔn)確的機(jī)器人控制系統(tǒng)。 四、優(yōu)勢(shì)總結(jié) 高并行性:FPGA的高并行性使其在處理大規(guī)模并行運(yùn)算時(shí)具有顯著
    發(fā)表于 07-29 17:05

    人工智能機(jī)器人的區(qū)別

    在當(dāng)今科技飛速發(fā)展的時(shí)代,人工智能(AI)和機(jī)器人已成為社會(huì)關(guān)注的熱點(diǎn)話題。盡管兩者在多個(gè)領(lǐng)域有著廣泛的應(yīng)用和交集,但它們本質(zhì)上是兩個(gè)不同的概念。本文將從定義、技術(shù)方向、功能、應(yīng)用范圍、研究重點(diǎn)及未來(lái)發(fā)展等方面,詳細(xì)探討
    的頭像 發(fā)表于 07-04 17:41 ?860次閱讀

    機(jī)器人視覺(jué)的應(yīng)用范圍

    機(jī)器人視覺(jué)是一種將計(jì)算機(jī)視覺(jué)技術(shù)應(yīng)用于機(jī)器人領(lǐng)域的技術(shù),它使得機(jī)器人能夠感知和理解周圍環(huán)境,實(shí)現(xiàn)
    的頭像 發(fā)表于 07-04 11:33 ?300次閱讀

    5G智能物聯(lián)網(wǎng)課程之Aidlux下人工智能開發(fā)(SC171開發(fā)套件V2)

    ://t.elecfans.com/v/27221.html *附件:初學(xué)者完整學(xué)習(xí)流程實(shí)現(xiàn)手寫數(shù)字識(shí)別案例_V2-20240506.pdf 人工智能 語(yǔ)音對(duì)話機(jī)器人案例 26分03秒 https
    發(fā)表于 05-10 16:46

    其利天下技術(shù)·搭載無(wú)刷電機(jī)的掃地機(jī)器人的前景如何?

    隨著人工智能和物聯(lián)網(wǎng)技術(shù)的不斷進(jìn)步,掃地機(jī)器人智能化程度也在不斷提高。現(xiàn)代掃地機(jī)器人已經(jīng)可以通過(guò)智能
    發(fā)表于 05-05 15:03

    5G智能物聯(lián)網(wǎng)課程之Aidlux下人工智能開發(fā)(SC171開發(fā)套件V1)

    *附件:初學(xué)者完整學(xué)習(xí)流程實(shí)現(xiàn)手寫數(shù)字識(shí)別案例.pdf 人工智能 語(yǔ)音對(duì)話機(jī)器人案例 26分03秒 https://t.elecfans.com/v/27185.html *附件:語(yǔ)音對(duì)話機(jī)
    發(fā)表于 04-01 10:40

    機(jī)器人自動(dòng)化焊接工作站的優(yōu)點(diǎn),技術(shù)特點(diǎn)及應(yīng)用

    在當(dāng)今高度自動(dòng)化的制造業(yè)環(huán)境中,機(jī)器人技術(shù)已經(jīng)成為不可或缺的一部分。其中,機(jī)器人自動(dòng)化焊接工作站以其高效、精確和穩(wěn)定的特性,正逐漸改變傳統(tǒng)焊
    的頭像 發(fā)表于 01-29 13:24 ?819次閱讀

    晶泰科技攜手ABB機(jī)器人打造柔性智能自動(dòng)化的實(shí)驗(yàn)室

    晶泰科技與ABB機(jī)器人聯(lián)合打造柔性自動(dòng)化、智能化的未來(lái)實(shí)驗(yàn)室,讓自動(dòng)化設(shè)備成為科研的手中利器,成為突破各科研領(lǐng)域效率瓶頸的日常工具。
    的頭像 發(fā)表于 01-19 16:49 ?1004次閱讀

    創(chuàng)想焊縫跟蹤系統(tǒng)適配歡顏機(jī)器人真正實(shí)現(xiàn)焊接自動(dòng)化智能化

    一起了解創(chuàng)想焊縫跟蹤系統(tǒng)適配歡顏機(jī)器人的應(yīng)用。 ?? 激光焊縫跟蹤系統(tǒng)原理: ??激光焊縫跟蹤系統(tǒng)是一種先進(jìn)的焊接技術(shù),其原理是利用高精度的傳感器對(duì)焊縫進(jìn)行實(shí)時(shí)檢測(cè),并通過(guò)對(duì)數(shù)據(jù)的處理和分析,
    的頭像 發(fā)表于 01-13 15:43 ?259次閱讀
    創(chuàng)想焊縫跟蹤系統(tǒng)適配歡顏<b class='flag-5'>機(jī)器人</b>真正<b class='flag-5'>實(shí)現(xiàn)</b>焊接<b class='flag-5'>自動(dòng)化</b>和<b class='flag-5'>智能化</b>

    上下料機(jī)器人,他可以替代人工執(zhí)行自動(dòng)化的物料搬運(yùn)任務(wù)

    “上下料機(jī)器人” 可能指的是自動(dòng)上料和下料的機(jī)器人系統(tǒng),通常用于工業(yè)生產(chǎn)線。這些機(jī)器人系統(tǒng)可以執(zhí)行自動(dòng)化的物料搬運(yùn)
    的頭像 發(fā)表于 01-08 15:53 ?407次閱讀
    上下料<b class='flag-5'>機(jī)器人</b>,他可以替代<b class='flag-5'>人工</b>執(zhí)行<b class='flag-5'>自動(dòng)化</b>的物料搬運(yùn)<b class='flag-5'>任務(wù)</b>

    網(wǎng)絡(luò)社交機(jī)器人檢測(cè)的關(guān)鍵技術(shù)

    在線社交網(wǎng)絡(luò)面臨著網(wǎng)絡(luò)社交機(jī)器人操控的威脅,而現(xiàn)有的檢測(cè)算法還不能緩解這種威脅。如何有效利用人工智能技術(shù)檢測(cè)社交機(jī)器人,規(guī)避其潛在的風(fēng)險(xiǎn)并保障網(wǎng)絡(luò)的良好生態(tài),是當(dāng)前亟需解決的重要任務(wù)。
    的頭像 發(fā)表于 12-28 17:05 ?782次閱讀
    網(wǎng)絡(luò)社交<b class='flag-5'>機(jī)器人</b>檢測(cè)的關(guān)鍵<b class='flag-5'>技術(shù)</b>

    機(jī)器人電源架構(gòu)的6個(gè)設(shè)計(jì)要點(diǎn)解析

    自動(dòng)化任務(wù)對(duì)提高效率而言至關(guān)重要,因此,即使您的機(jī)器人目前由人工控制,某些這類由人工控制的任務(wù)
    發(fā)表于 10-17 16:08 ?538次閱讀
    <b class='flag-5'>機(jī)器人</b>電源架構(gòu)的6個(gè)設(shè)計(jì)要點(diǎn)解析

    自動(dòng)化到自主、協(xié)調(diào),更加智能化的生產(chǎn)用機(jī)器人

    自動(dòng)化到自主、協(xié)調(diào),更加智能化的生產(chǎn)用機(jī)器人
    的頭像 發(fā)表于 10-16 17:50 ?589次閱讀
    從<b class='flag-5'>自動(dòng)化</b>到自主<b class='flag-5'>化</b>、協(xié)調(diào)<b class='flag-5'>化</b>,更加<b class='flag-5'>智能化</b>的生產(chǎn)用<b class='flag-5'>機(jī)器人</b>