0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

機器人:AI大模型終端落地的第三大方向?

Felix分析 ? 來源:電子發(fā)燒友網 ? 作者:吳子鵬 ? 2024-03-24 10:22 ? 次閱讀

電子發(fā)燒友網報道(文/吳子鵬)前有AI落地難,如今AI大模型的落地也遇到了一些挑戰(zhàn)。雖然各大企業(yè)推出了非常多的行業(yè)垂直大模型,不過這些模型基本上還是基于云端去實現(xiàn)。在終端,目前AI智能手機和AI PC是最熱門的兩大應用。

我們簡單看一下AI智能手機行業(yè),已經有數(shù)家廠商推出了配置在手機端的大模型。以vivo的藍心大模型為例,可以通過抓取屏幕中的內容,智能且直接地完成日程添加的操作,使用戶體驗更為便捷。還有榮耀MagicOS 8,大模型讓榮耀手機能夠捕獲用戶的意圖。在AI PC方面,道理大抵是相通的。

那么,除了原本就比較智能且出貨量較大的智能手機和PC之外,AI大模型還有什么終端方向值得去探索呢?OpenAI 給出的答案是機器人。

把ChatGPT裝進機器人的大腦

近日,機器人初創(chuàng)公司Figure發(fā)布了自己第一個OpenAI大模型加持的機器人demo。視頻內容顯示,當一個1.7米左右的機器人被植入GPT大模型之后,智能化水平顯著提升,不僅能夠和人類無違和對話,而且也具有非常強的動手能力。

根據demo內容,這個搭載GPT的機器人能夠非常準確地描述自己所見的內容,比如面前的蘋果和杯子,以及演示人員手部的動作。并且,當演示人員讓這個機器人遞些吃的東西過去時,它能夠在幾乎不需要反應時間的情況下將蘋果遞給演示人員。這個demo顯示出,搭載GPT的機器人已經具有非常高的“意識自主性”,雖然有些對話需要時間反應,不過他最終都能夠做出正確的舉措。

據悉,機器人初創(chuàng)公司Figure擁有一個豪華的技術團隊,創(chuàng)始人Adcock重金從波士頓動力、特斯拉、谷歌等公司挖了大量的人才。再加上有了GPT的加持,F(xiàn)igure 01機器人可以自主做計劃、執(zhí)行任務、有記憶、聽懂人話,離具身智能的程度更近一步。

上一個引起行業(yè)廣泛關注的機器人是VIMA(Vision-and-Language Navigation with Multi-Modal Transformers)。VIMA由李飛飛教授及來自斯坦福大學、加州理工、清華大學和英偉達的幾位學者組成的團隊聯(lián)合打造,是一個使用多模態(tài)提示執(zhí)行各類任務的機械操作系統(tǒng)。根據介紹,VIMA是一個帶有機械臂的LLM,可以接受多模態(tài)提示詞,單個的文本、圖像、視頻或這些信息的結合。

太平洋證券曾在研報中指出,雖然當前人形機器人的智能AI系統(tǒng)還不夠成熟,但當前ChatGPT的出現(xiàn)已展現(xiàn)了生成式AI具備較強理解和生成對話能力,結合OpenAI投資人形機器人賽道,以及特斯拉等巨頭的入局,看好未來人形機器人更快商業(yè)化落地。

無疑,F(xiàn)igure 01機器人展示出當下具身智能機器人的最新進展。具身智能機器人要求機器人能夠像人類一樣與環(huán)境交互、感知、規(guī)劃、決策、行動、執(zhí)行任務。英偉達創(chuàng)始人黃仁勛在 ITF World 2023 半導體大會上就大談特談具身智能。他認為,具身智能是能理解、推理、并與物理世界互動的智能系統(tǒng),是人工智能的下一個浪潮。

相信隨著AI大模型技術越來越成熟,這種大模型和機器人的融合會更加成熟,到時候機器人可能會無縫融入人類社會。

大模型融入機器人的挑戰(zhàn)

不過,憧憬是美好的,過程總是很艱辛。針對AI大模型和機器人的融合,當前還有很多困難需要克服,就像Figure 01機器人一樣,它還有很多細節(jié)問題無法很平滑地處理。

在2023年底舉辦的中國信通院人工智能論壇上,很多專家就談到了AI大模型的終端落地難題,其中一些問題實際上也是適用于機器人行業(yè)的。

比如,第一個是算力和存儲問題,當AI大模型在云端訓練時,相對算力還是比較充沛的,不過當部署到終端的時候,模型受限于算力和存儲能力的顯著下降就需要做瘦身。這就牽連出第二個問題,由于實際應用經驗嚴重匱乏,目前大部分AI大模型的瘦身都是“拍腦袋式”的,這也是為什么Figure 01機器人在一些問題上應對非常好,在一些問題上卻需要很久的推理思考。因此,在硬件問題上,成本就會是個大麻煩,成本太低的話,AI大模型受影響就會非常嚴重,成本太高的話就無法廣泛普及。

第二個是數(shù)據的問題,以機器人來說,最終落地到終端會有比較明確的場景。然而,就需要利用這類場景數(shù)據對AI大模型進行二次訓練,如何對這些數(shù)據進行高質量清洗,另外如何微調數(shù)據以達到更好的部署效果,這些都是巨大的挑戰(zhàn),因為有太多經驗空白區(qū)。有人會問,竟然要求具身智能,要像人類一樣,那么不是應該具有廣泛的知識嗎?理想形態(tài)當然是這樣,甚至是機器人在一些能力上超過人類,但是受限于硬件,短期看這是不現(xiàn)實的。

第三個是仿真和部署的問題。我們都知道,具身智能的機器人需要和物理世界接觸并融入物理世界。這就遇到了一個問題,智能體是基于虛擬仿真環(huán)境進行設計的,不過智能體部署之后,現(xiàn)實世界要復雜很多,如何將虛擬世界和物理世界耦合是一個更大的挑戰(zhàn)。這不僅要求智能體模型具有非常好的可擴展性和成長性,還需要一個強大的通用智能本體平臺??赡苡腥艘呀浵氲搅擞布阅苋哂?,不過考慮到可靠性和成本問題,單純性能冗余明顯是不夠的,特定場景通用走向社會性通用的過程中,硬件平臺架構創(chuàng)新是非常關鍵的。

目前,頭部企業(yè)實現(xiàn)AI大模型和機器人融合的方式有一些差異性。微軟公司使用ChatGPT大型語言模型 (LLM) 將人的語言快速轉換為機器人的高層控制代碼,然后轉化為機器人的控制;谷歌PaLM-E模型則是一種視覺路線,能夠觀察物理實體世界的信息,由大模型進行分析理解,再將決策結果反饋至物理世界;特斯拉則是打通FSD和機器人的底層模塊,實現(xiàn)一定的算法復用,特斯拉利用大規(guī)模的數(shù)據集訓練模型,可以提高算法在復雜環(huán)境下的性能,并認為自動駕駛的本質就是機器人。

從結果來看,目前AI大模型+機器人已經實現(xiàn)了一些功能,但是離通用智能和規(guī)模部署還有一段路要走。

結語

AI大模型如何在終端落地?這是一個困擾行業(yè)的問題,將本身就智能的智能手機和PC升級,這當然是一個路徑。不過,具身智能的機器人會有更大的想象空間,當然這條路道阻且長。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 機器人
    +關注

    關注

    210

    文章

    27839

    瀏覽量

    204596
  • AI大模型
    +關注

    關注

    0

    文章

    281

    瀏覽量

    213
收藏 人收藏

    評論

    相關推薦

    Al大模型機器人

    金航標kinghelm薩科微slkor總經理宋仕強介紹說,薩科微Al大模型機器人有哪些的優(yōu)勢?薩科微AI模型機器人由清華大學畢業(yè)的天才少年
    發(fā)表于 07-05 08:52

    優(yōu)必選宣布人形機器人Walker S接入百度文心大模型

    優(yōu)必選宣布人形機器人Walker S接入百度文心大模型,共同探索中國AI模型+人形機器人的應用。
    的頭像 發(fā)表于 04-07 10:17 ?746次閱讀

    底層硬件加大模型,智能機器狗拓展更多落地應用

    電子發(fā)燒友網報道(文/李寧遠)在生成式AI、大模型已經席卷了各行各業(yè)的當下,人形機器人是最受備受關注的機器人類型。在人形機器人或者說仿生雙足
    的頭像 發(fā)表于 03-29 00:11 ?2503次閱讀

    NVIDIA Isaac機器人平臺升級,加速AI機器人技術革新

    NVIDIA Isaac機器人平臺近期實現(xiàn)重大升級,通過引入最新的生成式AI技術和先進的仿真技術,顯著加速了AI機器人技術的發(fā)展步伐。該平臺正不斷擴展其基礎
    的頭像 發(fā)表于 03-27 10:36 ?502次閱讀

    星加大機器人產業(yè)投資以應對競爭加劇

    在此次機器人與人形機器人的重要會議中,韓國星集團邀請了多名領域內的頂尖專家,商討如何應對AI產生式浪潮下的挑戰(zhàn),以便迅速調整方向,使
    的頭像 發(fā)表于 03-05 13:57 ?242次閱讀

    人形機器人成為車圈“新寵”?

    現(xiàn)在的人形機器人不僅形態(tài)更接近人類,而且具備更多的智慧。隨著大型AI模型的不斷推進,人工智能正在加速人形通用機器人的量產和落地。
    發(fā)表于 02-22 09:22 ?332次閱讀
    人形<b class='flag-5'>機器人</b>成為車圈“新寵”?

    廣和通AI解決方案“智”賦室外機器人邁向新天地!

    模型趨勢下,行業(yè)機器人將具備更完善的交互與自主能力,逐步邁向AI2.0時代,成為人工智能技術全面爆發(fā)的重要基礎。隨著行業(yè)智能化,更多機器人應用將從“室內”走向“室外”,承擔更多高風險
    的頭像 發(fā)表于 01-18 11:51 ?430次閱讀
    廣和通<b class='flag-5'>AI</b>解決方案“智”賦室外<b class='flag-5'>機器人</b>邁向新天地!

    機器人擁抱AI模型已成共識!

    目前普遍的共識是,機器人擁抱AI模型的過程就是具身智能機器人的實現(xiàn)過程,融合AI模型的具身智
    發(fā)表于 12-22 17:08 ?335次閱讀

    LabVIEW的六軸工業(yè)機器人運動控制系統(tǒng)

    。 系統(tǒng)研究與算法開發(fā):首先,項目圍繞機器人的數(shù)學模型,特別是空間位姿描述和D-H模型展開研究。在此基礎上,開發(fā)了機器人的運動學正反解算法,使用了雅克比-迭代法等先進技術。此外,還涉及
    發(fā)表于 12-21 20:03

    高動態(tài)人形機器人“夸父”通過OpenHarmony 3.2 Release版本兼容性測評

    近日, 搭載KaihongOS的“夸父”人形機器人通過OpenAtom OpenHarmony(以下簡稱“OpenHarmony”)3.2 Release版本兼容性測評并獲頒兼容性證書 。這體現(xiàn)了
    發(fā)表于 12-20 09:31

    機器人的ROS模型建立

    這個系列主要介紹機器人ROS模型的建立方法,ROS系統(tǒng)帶來的好處之一就是: 我們無需自己建立復雜的數(shù)學模型來描述自己的機器人幾何尺寸、運動學和動力學等,只需要用它提供的
    的頭像 發(fā)表于 11-28 14:19 ?491次閱讀

    如何創(chuàng)建機器人模型

    完整機器人模型 所有的link和joint標簽完成了對機器人每個部分的描述和組合,全都放在一個robot標簽中,就形成了完整的機器人模型
    的頭像 發(fā)表于 11-22 17:09 ?742次閱讀
    如何創(chuàng)建<b class='flag-5'>機器人</b><b class='flag-5'>模型</b>

    AI人形機器人研究:與汽車行業(yè)聯(lián)動,主機廠押注人形機器人賽道

    2023年7月,谷歌DeepMind推出了機器人模型Robotics Transformer 2 (RT-2),這是一個視覺-語言-動作(VLA)模型,實現(xiàn)了視覺語言模型
    的頭像 發(fā)表于 11-20 17:32 ?1002次閱讀
    <b class='flag-5'>AI</b>人形<b class='flag-5'>機器人</b>研究:與汽車行業(yè)聯(lián)動,主機廠押注人形<b class='flag-5'>機器人</b>賽道

    基于動力學模型機器人介紹

    機器人具有高度非線性,強時變以及強耦合等動力學特性,為了提高機器人控制的性能,研究人員提出了基于模型的控制(Model Based Control)方法。 在機器人研究領域,多種常見的
    的頭像 發(fā)表于 11-17 17:43 ?677次閱讀

    人形機器人落地思考

    都會將關注的目光從概念樣機轉向商業(yè)落地,當下人形機器人最迫切目標就是需要走出實驗室推向商用場景,所以規(guī)?;?b class='flag-5'>落地將是人形機器人在下個階段面臨的真正考驗:一炮而紅or曇花一現(xiàn)。
    的頭像 發(fā)表于 10-18 15:32 ?774次閱讀