0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

莫拉維克悖論與多模態(tài)AI:邁向機(jī)器人認(rèn)知的新時(shí)代

要長(zhǎng)高 ? 2024-10-26 15:00 ? 次閱讀

莫拉維克悖論揭示了人工智能系統(tǒng)在處理高級(jí)推理與基本感知運(yùn)動(dòng)技能上的巨大差異。對(duì)于AI而言,復(fù)雜的邏輯任務(wù)似乎比人類習(xí)以為常的感知運(yùn)動(dòng)技能更容易實(shí)現(xiàn)。這一悖論凸顯了當(dāng)前AI與人類認(rèn)知能力之間的鴻溝。

然而,人類作為多模態(tài)生物,通過視覺、語(yǔ)言、聲音、觸覺、味覺和嗅覺等多種感官模式來(lái)了解世界,并進(jìn)行分析、推理和決策。這種多模態(tài)感知與認(rèn)知能力是人類智能的重要組成部分。

隨著傳感器技術(shù)和AI的演進(jìn),機(jī)器人也開始配備多模態(tài)傳感器。這些設(shè)備能夠感知周圍環(huán)境,理解自然語(yǔ)言,并通過數(shù)字傳感界面獲得觸覺等多種信息。隨著計(jì)算能力的不斷提升,機(jī)器人正變得越來(lái)越智能。

近年來(lái),Transformer和大語(yǔ)言模型(LLM)的出現(xiàn)推動(dòng)了多模態(tài)AI的快速發(fā)展。這些模型使得單個(gè)模型能夠同時(shí)處理和理解多種數(shù)據(jù)類型,從而提高了AI系統(tǒng)的綜合感知能力。例如,CLIP能夠理解與自然語(yǔ)言配對(duì)的圖像,DALL·E則能根據(jù)文本描述生成圖像。而GPT-4等模型則進(jìn)一步提高了人機(jī)交互的性能,能夠在音頻、視覺和文本之間實(shí)時(shí)推理。

2024年,多模態(tài)AI的演進(jìn)速度進(jìn)一步加快。OpenAI發(fā)布的Sora能夠根據(jù)文本描述生成逼真的視頻,為構(gòu)建通用世界模擬器提供了可能。而GPT-4o則顯著提高了人機(jī)交互的效率和效果,能夠綜合利用多種信息來(lái)做出更準(zhǔn)確的判斷和決策。

與此同時(shí),谷歌也發(fā)布了Gemini 1.5等模型,將上下文長(zhǎng)度大幅擴(kuò)展,使得AI能夠一次性處理更多信息。谷歌還探討了Project Astra的未來(lái)愿景,旨在打造一款能夠處理多模態(tài)信息、理解上下文并在對(duì)話中自然交互的通用AI助手。

多模態(tài)AI的發(fā)展為機(jī)器人帶來(lái)了前所未有的變革。過去,機(jī)器人往往只能執(zhí)行單一任務(wù),缺乏學(xué)習(xí)和適應(yīng)能力。而現(xiàn)在,多模態(tài)LLM有望改變機(jī)器人的分析、推理和學(xué)習(xí)能力,使機(jī)器人從專用走向通用。這種通用化將推動(dòng)機(jī)器人技術(shù)的規(guī)?;瘧?yīng)用,降低價(jià)格,并拓展到更多領(lǐng)域。

然而,要使機(jī)器人技術(shù)成為主流,還需要解決能效、安全性和功能安全等問題。Arm處理器作為未來(lái)機(jī)器人技術(shù)的基石,已廣泛應(yīng)用于機(jī)器人領(lǐng)域。Arm認(rèn)為,機(jī)器人腦應(yīng)包括“大腦”和“小腦”,采用異構(gòu)AI計(jì)算系統(tǒng)以提供出色的性能、實(shí)時(shí)響應(yīng)和高能效。此外,還需要操作系統(tǒng)、實(shí)時(shí)操作系統(tǒng)(RTOS)以及針對(duì)機(jī)器人定制的Linux發(fā)行版等軟件的支持。

綜上所述,莫拉維克悖論揭示了AI與人類認(rèn)知能力之間的差異,而多模態(tài)AI的發(fā)展則為機(jī)器人帶來(lái)了前所未有的變革。隨著技術(shù)的不斷進(jìn)步和生態(tài)系統(tǒng)的完善,我們有理由相信,未來(lái)機(jī)器人將成為我們生活中不可或缺的一部分,為人類社會(huì)帶來(lái)更多的便利和價(jià)值。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 機(jī)器人
    +關(guān)注

    關(guān)注

    210

    文章

    28125

    瀏覽量

    205888
  • 人工智能
    +關(guān)注

    關(guān)注

    1791

    文章

    46689

    瀏覽量

    237179
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    【書籍評(píng)測(cè)活動(dòng)NO.51】具身智能機(jī)器人系統(tǒng) | 了解AI的下一個(gè)浪潮!

    。 近期,中國(guó)機(jī)器人研發(fā)團(tuán)隊(duì)在模態(tài)交互、語(yǔ)言模型運(yùn)用,以及復(fù)雜任務(wù)規(guī)劃等方面取得了突破。 我國(guó)具身智能機(jī)器人產(chǎn)業(yè)已有一定基礎(chǔ),特別是在粵港澳大灣區(qū)。 以 2023 年具身智能
    發(fā)表于 11-11 10:20

    王耀南院士:AI大模型賦能人形機(jī)器人及未來(lái)趨勢(shì)

    他以多個(gè)案例詳細(xì)介紹了用AI大模型賦能具身智能人形機(jī)器人的思路和方法,他提出未來(lái)在具身智能人形機(jī)器人方向上需要突破腦認(rèn)知情感機(jī)理、
    的頭像 發(fā)表于 11-08 11:03 ?379次閱讀
    王耀南院士:<b class='flag-5'>AI</b>大模型賦能人形<b class='flag-5'>機(jī)器人</b>及未來(lái)趨勢(shì)

    下一代機(jī)器人和具身智能背后的新技術(shù)

    你聽過悖論 (Moravec's paradox) 嗎?它是指,對(duì)于人工智能 (AI
    的頭像 發(fā)表于 09-14 09:35 ?350次閱讀

    Al大模型機(jī)器人

    金航標(biāo)kinghelm薩科微slkor總經(jīng)理宋仕強(qiáng)介紹說,薩科微Al大模型機(jī)器人有哪些的優(yōu)勢(shì)?薩科微AI大模型機(jī)器人由清華大學(xué)畢業(yè)的天才少年N博士和王博士團(tuán)隊(duì)開發(fā),與同行相比具有許多優(yōu)勢(shì):語(yǔ)言
    發(fā)表于 07-05 08:52

    NVIDIA三大平臺(tái)引領(lǐng)AI機(jī)器人新時(shí)代

    隨著科技的不斷進(jìn)步,AI機(jī)器人已成為制造業(yè)轉(zhuǎn)型升級(jí)的重要驅(qū)動(dòng)力。NVIDIA憑借其Omniverse、Metropolis和Isaac三大平臺(tái),正在與富士康、比亞迪電子、西門子、泰瑞達(dá)和Intrinsic等全球知名企業(yè)共同打造數(shù)字孿生,引領(lǐng)
    的頭像 發(fā)表于 06-04 14:57 ?734次閱讀

    英偉達(dá)CEO黃仁勛展望AI機(jī)器人新時(shí)代

    在COMPUTEX 2024大會(huì)上,英偉達(dá)CEO黃仁勛發(fā)表了激動(dòng)人心的演講,他看好機(jī)器人即將跨入擁有更強(qiáng)感知能力和系統(tǒng)的全新時(shí)代。黃仁勛強(qiáng)調(diào)了自家人工智能(AI)Omniverse技術(shù)在這一領(lǐng)域的巨大潛力,該技術(shù)將助力
    的頭像 發(fā)表于 06-03 11:30 ?699次閱讀

    華為云陳海永:新通話開啟模態(tài)通信新時(shí)代

    5月25日,“第七屆數(shù)字中國(guó)建設(shè)峰會(huì)·2024中國(guó)移動(dòng)AI+產(chǎn)品分論壇”在福州舉辦。在論壇上,華為云核心網(wǎng)產(chǎn)品線CS&IMS領(lǐng)域總裁陳海永做了《新通話開啟模態(tài)通信新時(shí)代》的主題演講。
    的頭像 發(fā)表于 05-27 10:18 ?476次閱讀

    李未可科技正式推出WAKE-AI模態(tài)AI大模型

    李未可科技模態(tài) AI 大模型正式發(fā)布,積極推進(jìn) AI 在終端的場(chǎng)景應(yīng)用 ? 4月18日,2024中國(guó)生成式AI大會(huì)上李未可科技正式發(fā)布為眼
    發(fā)表于 04-18 17:01 ?557次閱讀
    李未可科技正式推出WAKE-<b class='flag-5'>AI</b><b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b><b class='flag-5'>AI</b>大模型

    AI機(jī)器人迎來(lái)模態(tài)模型

    配備 GR00T 模型的機(jī)器人由于需要“吸收消化”外界的模態(tài)信息,還要快速完成理解、決策、行動(dòng)等一系列動(dòng)作,因此對(duì)于算力的需求是巨量的。
    發(fā)表于 04-12 10:39 ?250次閱讀

    英偉達(dá)引領(lǐng)AI新潮流,推出“Chat with RTX”聊天機(jī)器人

    隨著人工智能技術(shù)的突飛猛進(jìn),英偉達(dá)(NVIDIA)再次展現(xiàn)了其技術(shù)領(lǐng)導(dǎo)地位,為Windows PC用戶帶來(lái)了一款革命性的本地聊天機(jī)器人應(yīng)用程序——“Chat with RTX”。這一創(chuàng)新應(yīng)用的推出,不僅標(biāo)志著人工智能在日常生活中的進(jìn)一步滲透,也預(yù)示著聊天機(jī)器人
    的頭像 發(fā)表于 02-19 11:11 ?930次閱讀

    鰭源全球首創(chuàng)QY-MT智測(cè)系統(tǒng):引領(lǐng)水下機(jī)器人邁向AI無(wú)損測(cè)量新時(shí)代

    測(cè)量精度、測(cè)量方式、實(shí)時(shí)數(shù)據(jù)可視化的無(wú)損智能水下測(cè)量新方式,引領(lǐng)水下機(jī)器人測(cè)量邁向AI無(wú)損智測(cè)新時(shí)代! 水下測(cè)量作為重要的作業(yè)環(huán)節(jié),常用于
    的頭像 發(fā)表于 02-02 09:12 ?356次閱讀

    機(jī)器人基于開源的模態(tài)語(yǔ)言視覺大模型

    ByteDance Research 基于開源的模態(tài)語(yǔ)言視覺大模型 OpenFlamingo 開發(fā)了開源、易用的 RoboFlamingo 機(jī)器人操作模型,只用單機(jī)就可以訓(xùn)練。
    發(fā)表于 01-19 11:43 ?352次閱讀
    <b class='flag-5'>機(jī)器人</b>基于開源的<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>語(yǔ)言視覺大模型

    廣和通AI解決方案“智”賦室外機(jī)器人邁向新天地!

    大模型趨勢(shì)下,行業(yè)機(jī)器人將具備更完善的交互與自主能力,逐步邁向AI 2.0時(shí)代,成為人工智能技術(shù)全面爆發(fā)的重要基礎(chǔ)。隨著行業(yè)智能化,更多機(jī)器人
    的頭像 發(fā)表于 01-18 11:52 ?295次閱讀

    廣和通AI解決方案“智”賦室外機(jī)器人邁向新天地!

    大模型趨勢(shì)下,行業(yè)機(jī)器人將具備更完善的交互與自主能力,逐步邁向AI2.0時(shí)代,成為人工智能技術(shù)全面爆發(fā)的重要基礎(chǔ)。隨著行業(yè)智能化,更多機(jī)器人
    的頭像 發(fā)表于 01-18 11:51 ?483次閱讀
    廣和通<b class='flag-5'>AI</b>解決方案“智”賦室外<b class='flag-5'>機(jī)器人</b><b class='flag-5'>邁向</b>新天地!

    機(jī)器人擁抱AI大模型已成共識(shí)!

    目前普遍的共識(shí)是,機(jī)器人擁抱AI大模型的過程就是具身智能機(jī)器人的實(shí)現(xiàn)過程,融合AI大模型的具身智能機(jī)器人將是未來(lái)
    發(fā)表于 12-22 17:08 ?360次閱讀