0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

人形機(jī)器人+大模型,為什么是投資人追逐的新風(fēng)口?

甲子光年 ? 來(lái)源:甲子光年 ? 2023-08-24 15:01 ? 次閱讀

通用機(jī)器人來(lái)了?

“一個(gè)上午,接待了40多個(gè)投資人來(lái)現(xiàn)場(chǎng),都是來(lái)看人形機(jī)器人的?!币晃蛔芬拞T工說(shuō)道。

有投資人指著正在表演咖啡拉花的機(jī)器人問(wèn):“這個(gè)動(dòng)作的難度在哪兒?”另一邊,一位自稱開(kāi)煤礦的老板指的旁邊站立的另一臺(tái)人形機(jī)器人問(wèn):“多少錢,怎么訂?”

2023世界機(jī)器人上,以前只能在科幻電影中出現(xiàn)的人形機(jī)器人在現(xiàn)場(chǎng)表演起了各種技能。小米、追覓科技、優(yōu)必選、達(dá)闥科技、宇樹(shù)科技、大連蒂艾斯科技、星動(dòng)紀(jì)元、理工華匯等很多公司都把自己的人形機(jī)器人搬到了現(xiàn)場(chǎng)。

這是2023世界機(jī)器人大會(huì)上熱鬧的一角。今年的大會(huì),160家國(guó)內(nèi)外機(jī)器人企業(yè),600件機(jī)器人都在現(xiàn)場(chǎng)久違的大秀了一把肌肉。人形機(jī)器人搶走了大部分風(fēng)頭。全球知名的波士頓動(dòng)力創(chuàng)始人Marc Raibert、日本知名機(jī)器人學(xué)者石黑浩都來(lái)了。

人形機(jī)器人正在成為資本市場(chǎng)的新熱點(diǎn)。一級(jí)市場(chǎng),百度、經(jīng)緯、高瓴、鼎暉、高榕、云啟、真格、梅花創(chuàng)投等都在一線積極調(diào)研,前半年聊大模型的風(fēng)投現(xiàn)在沒(méi)有人不關(guān)心通用機(jī)器人。

目前國(guó)內(nèi)外已經(jīng)有一些出手的案例:

美國(guó)人形機(jī)器人創(chuàng)業(yè)公司Figure兩個(gè)月就完成了兩輪融資:7月獲得了英特爾投資的900萬(wàn)美元投資;今年5月,F(xiàn)igure完成了7000萬(wàn)美元A輪融資,由Parkway Venture Capital領(lǐng)投。根據(jù)路透社報(bào)道,在5月融資時(shí),F(xiàn)igure估值已經(jīng)超過(guò)4億美元。

國(guó)內(nèi)市場(chǎng),曾經(jīng)的華為天才少年稚暉君創(chuàng)立的智元機(jī)器人(Agibot)也正在受到一線基金的追捧,百度、經(jīng)緯、高瓴、鼎暉、高榕等均參與了投資。

近日,通用機(jī)器人公司月泉仿生也完成了一輪由北京北科中發(fā)展啟航創(chuàng)業(yè)投資基金的獨(dú)家投資。月泉仿生的核心業(yè)務(wù)是通用型仿生人形機(jī)器人及核心零部件的產(chǎn)業(yè)化。月泉仿生由吉林大學(xué)工程仿生教育部重點(diǎn)實(shí)驗(yàn)室任露泉院士團(tuán)隊(duì)創(chuàng)立。

二級(jí)市場(chǎng),人形機(jī)器人概念股都炒了幾波。5月,馬斯克在2023年股東大會(huì)上關(guān)于人形機(jī)器人Optimus的一番話,直接拉漲了一波A股機(jī)器人概念——賽摩智能20CM漲停,豐立智能在六個(gè)交易日漲幅近160%,直接引發(fā)了深交所的關(guān)注,要求說(shuō)明股價(jià)漲幅較大的原因及合理性。

為何人形機(jī)器人成為了香餑餑?投資人扎堆調(diào)研的背后,人形機(jī)器人面臨哪些機(jī)會(huì)和挑戰(zhàn)?

1.特斯拉、小米、追覓熱火朝天的人形機(jī)器人

特斯拉是這波人形機(jī)器人熱潮的直接推動(dòng)者。

在2023年股東大會(huì)上,馬斯克說(shuō),人形機(jī)器人Optimus對(duì)運(yùn)動(dòng)和力量的控制以及環(huán)境感知方面有顯著加強(qiáng),技術(shù)正在快速迭代。他預(yù)測(cè),機(jī)器人的需求可能會(huì)達(dá)到100億,甚至更多。如果以人類和機(jī)器人的比例為2:1,那么對(duì)人形機(jī)器人的需求可能會(huì)遠(yuǎn)遠(yuǎn)超過(guò)汽車的需求。

馬斯克的相信和投入點(diǎn)燃了很多人對(duì)人形機(jī)器人賽道的信心。

特斯拉有可能會(huì)推動(dòng)整個(gè)產(chǎn)業(yè)鏈走向成熟。梅花創(chuàng)投創(chuàng)始合伙人吳世春告訴「甲子光年」:“在新能源汽車產(chǎn)業(yè)鏈領(lǐng)域,特斯拉帶動(dòng)智能汽車產(chǎn)業(yè)鏈整體向前發(fā)展,它在上海的工廠帶動(dòng)了整個(gè)中國(guó)智能產(chǎn)業(yè)鏈的逐步成熟。下一個(gè)可能是人形機(jī)器人?!?/p>

“這是好事,我們也在觀察這個(gè)行業(yè)里哪些地方有投資機(jī)會(huì),可能是整機(jī)、零部件或軟件?!眳鞘来赫f(shuō)。

在特斯拉2022 AI Day活動(dòng)上,特斯拉人形機(jī)器人“Optimus”首次亮相,并在現(xiàn)場(chǎng)完成了自主行走、轉(zhuǎn)身、停止、揮手問(wèn)候等動(dòng)作。雖然在本屆機(jī)器人大會(huì)中沒(méi)有看到“Optimus”的身影,但在今年的世界人工智能大會(huì)上,我們?cè)谏虾R?jiàn)到了一款在櫥窗里的“Optimus”。

“Optimus”采用了與汽車一致的計(jì)算機(jī)視覺(jué)、處理視覺(jué)數(shù)據(jù)、做出行動(dòng)決策、支持通信交流的“大腦”,以及與特斯拉車輛相同的芯片,還搭載與特斯拉車輛同源的FSD電腦以及Autopilot相關(guān)神經(jīng)網(wǎng)絡(luò)技術(shù),預(yù)計(jì)最終售價(jià)不超2萬(wàn)美元(約14.4萬(wàn)元人民幣)。

明勢(shì)資本創(chuàng)始合伙人黃明明認(rèn)為,電動(dòng)汽車公司做人形機(jī)器人有先天優(yōu)勢(shì)?!皟赡昵榜R斯克要做Tesla Bot的時(shí)候,很多人覺(jué)得他不務(wù)正業(yè)。但如果仔細(xì)分析特斯拉的技術(shù)棧會(huì)發(fā)現(xiàn),機(jī)器人是電動(dòng)汽車的自然延伸。車是第一代的四輪機(jī)器人,理想汽車今年年初確定的愿景不是成為全球最大的電動(dòng)車企業(yè),而是成為最優(yōu)秀的人工智能和機(jī)器人公司?!?/p>

他提到,認(rèn)知型機(jī)器人是下一個(gè)巨大突破?!翱赡苁侨诵?,也可能是四足?,F(xiàn)在我們?cè)诠S、產(chǎn)線、物流已經(jīng)有各種各樣的機(jī)器人,但這些機(jī)器人的程序都是人類工程師寫好的,動(dòng)作是被我們固定好的。但是認(rèn)知型機(jī)器人和自動(dòng)駕駛一樣,有感知、分析判斷能力,有人機(jī)交互能力、對(duì)于3D世界的實(shí)時(shí)理解能力,以及精準(zhǔn)的操作能力?!?/p>

人形機(jī)器人的的任務(wù)泛化能力決定了它能走的多遠(yuǎn)。很多企業(yè)正在瞄準(zhǔn)這個(gè)方向發(fā)力。

智元機(jī)器人最近發(fā)布的具身智能機(jī)器人遠(yuǎn)征A1就是一款人形機(jī)器人,稚暉君稱:“智元機(jī)器人致力于將先進(jìn)的機(jī)器人和AI技術(shù)與人類生活以及生產(chǎn)制造緊密結(jié)合,未來(lái)讓機(jī)器人成為人類的得力助手。遠(yuǎn)征A1未來(lái)可以在各種復(fù)雜場(chǎng)景下自主完成移動(dòng)和操作任務(wù)?!?/p>

前述提到的創(chuàng)業(yè)公司月泉仿生的機(jī)器人已經(jīng)能夠做到和人手相似的靈巧性。公司自主研發(fā)的類人仿生智能靈巧手在外力干擾下可以通過(guò)主動(dòng)移動(dòng)、屈曲、翻轉(zhuǎn)等動(dòng)作調(diào)整,以保持手持物體不掉落?!俺嘶A(chǔ)的抓握、按壓等動(dòng)作外,還可以完成27種不同的手部復(fù)雜精細(xì)操作,比如使用筷子夾取細(xì)小物體、涂抹護(hù)膚品、攪拌咖啡、刷手機(jī)、解扣子等?!睋?jù)悉,月泉仿生智能靈巧手采用拉壓體驅(qū)動(dòng)技術(shù),擁有極高自由度。同時(shí)內(nèi)置了柔性傳感器,具有觸覺(jué)神經(jīng)反饋。

3d9a15ea-4246-11ee-a2ef-92fbcf53809c.gif

????

月泉仿生智能靈巧手,公司供圖

月泉仿生CTO趙迪告訴「甲子光年」,目前關(guān)節(jié)型的人形機(jī)器人普遍只能進(jìn)行抓取拿放,很難執(zhí)行解扣子這種更復(fù)雜的動(dòng)作。人形機(jī)器人要想真正服務(wù)人類,一個(gè)好用能干活的雙手是必需的,因此在底層原理方面創(chuàng)新突破并提出全新的構(gòu)型顯得尤為重要。

人形機(jī)器人運(yùn)動(dòng)方面,月泉仿生同樣圍繞著“仿生拉壓體機(jī)器人”這一自主創(chuàng)新理論展開(kāi)研究。趙迪提到,“正常情況下,一個(gè)關(guān)節(jié)最高可有6個(gè)自由度,但關(guān)節(jié)驅(qū)動(dòng)機(jī)器人為了追求控制精度鎖死了自由度,實(shí)際最多只有1~3個(gè)自由度,由此造成功耗水平也很高,是人體運(yùn)動(dòng)功耗水平的幾十倍乃至上百倍?!?/p>

據(jù)他介紹,月泉的仿生拉壓體機(jī)器人能夠克服傳統(tǒng)關(guān)節(jié)驅(qū)動(dòng)機(jī)器人的缺點(diǎn),使機(jī)器人具備與人相似的運(yùn)動(dòng)特性,可以在具備較高運(yùn)動(dòng)自由度的情況下,能夠兼顧穩(wěn)定性,并且能實(shí)現(xiàn)關(guān)節(jié)剛度的快速自適應(yīng)調(diào)節(jié)同時(shí)能使機(jī)器人實(shí)現(xiàn)與環(huán)境的安全交互,運(yùn)動(dòng)能耗指標(biāo)僅為人體的一到兩倍。同時(shí),由于采用了新的驅(qū)動(dòng)方式,月泉仿生的產(chǎn)品不再需要使用復(fù)雜昂貴的減速器,降低了成本。據(jù)了解,公司也自研了微電機(jī)和仿生材料,以匹配拉壓體驅(qū)動(dòng)方式的性能需要。

在機(jī)器人大會(huì)現(xiàn)場(chǎng),我們也看到非常多在展現(xiàn)各種技能的人形機(jī)器人。

追覓把今年3月新發(fā)布的人形機(jī)器人帶到了現(xiàn)場(chǎng),這是一款身高 178cm,體重 56kg的機(jī)器人,全身共 44個(gè)自由度,其中單腿還有完整的6個(gè)自由度,可以完成單腿站立。此外,機(jī)器人身上還配備了深度相機(jī),可以完成室內(nèi)3維環(huán)境的建模,同時(shí)還集成了AI大語(yǔ)言模型,可以進(jìn)行實(shí)時(shí)溝通對(duì)話。

追覓科技人形機(jī)器人負(fù)責(zé)人喻超告訴「甲子光年」:“人形機(jī)器人自主實(shí)現(xiàn)咖啡‘拉花’的難點(diǎn)在于,它需要在開(kāi)放空間里與人進(jìn)行交互,這意味著它所處的空間位置和運(yùn)動(dòng)軌跡會(huì)有許多不確定性,同時(shí)需要識(shí)別不同材質(zhì)及尺寸的工具。要解決這些問(wèn)題,就要搭載更多的智能模型、傳感器,并在機(jī)械結(jié)構(gòu)設(shè)計(jì)上做創(chuàng)新調(diào)整?!?/p>

機(jī)器人公司宇樹(shù)科技不僅帶來(lái)了已經(jīng)在行業(yè)場(chǎng)景中落地的四足機(jī)器人,也帶來(lái)最新發(fā)布的人形機(jī)器人H1。

這是一款能跑的全尺寸通用人形機(jī)器人,擁有全球近似規(guī)格最高動(dòng)力性能,并配置有360°全景深度感知,行走速度大于1.5m/s,潛在運(yùn)動(dòng)能力大于5m/s,整機(jī)重量約在47kg左右。相關(guān)人員告訴「甲子光年」,H1會(huì)在下半年正式投入生產(chǎn),價(jià)格在幾十萬(wàn)元人民幣以內(nèi)。

即使被人從側(cè)面,后面踹一腳,H1都可以像人一樣,稍微踉蹌之后還能找到新的平衡,不會(huì)摔倒。一位機(jī)器人工程師告訴「甲子光年」:“實(shí)現(xiàn)這種功能并不是一件容易的事,背后用哪個(gè)數(shù)學(xué)函數(shù)大家都知道,但是能把它真正落地到產(chǎn)品中很難?!?/p>

大家對(duì)小米的好奇更多集中在最新發(fā)布的四足機(jī)器人身上,去年發(fā)布的人形機(jī)器人“鐵大”反而少有人在關(guān)注。據(jù)「甲子光年」了解,去年小米發(fā)布的人形機(jī)器人“鐵大”由追覓制造,后者本身也是小米生態(tài)鏈中的一員,在高度馬達(dá)等多個(gè)軟硬件方面有一些經(jīng)驗(yàn)積累。

達(dá)闥把人形雙足機(jī)器人“七仙女”小紫帶到了現(xiàn)場(chǎng),這款機(jī)器人身高165cm,體重65kg,全身采用了輕質(zhì)高強(qiáng)度的碳纖維復(fù)合材料,擁有60多個(gè)智能柔性關(guān)節(jié),由達(dá)闥全棧自研,搭載了海睿云端大腦操作系統(tǒng),集成了機(jī)器人多模態(tài)人工智能大模型RobotGPT?,F(xiàn)場(chǎng)還有一個(gè)人形機(jī)器人穿著球衣在表演定點(diǎn)投籃。達(dá)闥創(chuàng)始人兼CEO黃曉慶稱,“七仙女”將在2024年正式發(fā)布,2025年規(guī)模量產(chǎn)。

來(lái)自浙江大學(xué)控制學(xué)院機(jī)器人團(tuán)隊(duì)的同學(xué)也帶著“悟空-4”人形機(jī)器人來(lái)到了會(huì)上。據(jù)了解,“悟空-4”可適應(yīng)室外路面、草叢、泥濘路面等多種地形,最快運(yùn)動(dòng)速度可以達(dá)到6公里/小時(shí),還能跳高0.5米,還可以可上下25度斜坡和10厘米臺(tái)階。在路面打滑和外部推力干擾等未知擾動(dòng)下,可快速恢復(fù)平衡并保持穩(wěn)定行走。

47b79f3e-4246-11ee-a2ef-92fbcf53809c.png

浙江大學(xué)供圖

“悟空-4”通過(guò)融合腿足運(yùn)動(dòng)技術(shù)與環(huán)境感知技術(shù),實(shí)現(xiàn)了機(jī)器人的三維環(huán)境地圖構(gòu)建和自主動(dòng)態(tài)導(dǎo)航。該項(xiàng)目導(dǎo)師是朱秋國(guó)和熊蓉,都是機(jī)器人領(lǐng)域的專家,長(zhǎng)期從事腿足機(jī)器人、機(jī)器人智能感知控制、群體協(xié)作控制等研究,有深厚的理論與技術(shù)基礎(chǔ)。

清華大學(xué)交叉信息研究院和上海期智研究院所孵化的創(chuàng)業(yè)公司星動(dòng)紀(jì)元也帶著人形機(jī)器人產(chǎn)品來(lái)到了現(xiàn)場(chǎng)。

這次,星動(dòng)紀(jì)元的兩款產(chǎn)品小星和小星MAX都進(jìn)行了現(xiàn)場(chǎng)演示。小星在水泥地上、樹(shù)林里、草地里、石子路上都能快速行走,且有一定的穩(wěn)定性。

這兩款機(jī)器人產(chǎn)品背后,是公司自主研發(fā)的一系列軟硬件技術(shù):基于本體感知驅(qū)動(dòng)器的人形機(jī)器人本體;使用自研高扭矩密度模塊化關(guān)節(jié)以及一體化結(jié)構(gòu)設(shè)計(jì);以高強(qiáng)度合金、碳纖維和工程塑料等先進(jìn)材料,保留美觀外形,提高了結(jié)構(gòu)的強(qiáng)度和穩(wěn)定性;布局大語(yǔ)言模型,配以先進(jìn)的力控算法,具備高動(dòng)態(tài)性能的同時(shí)能更好地理解人類。

從投資人追捧、頭部科技公司入局,到創(chuàng)業(yè)公司和高校的創(chuàng)新研究,眼下,人形機(jī)器人正在多個(gè)方向齊頭并進(jìn),迎來(lái)新的發(fā)展階段。

2.給人形機(jī)器人裝上大腦

大模型是推動(dòng)人形機(jī)器人走向熱潮的另一重關(guān)鍵技術(shù)變量。

OpenAI靠一己之力讓人類邁進(jìn)了通用人工智能的大門前。大模型的觸角正在進(jìn)入各行各業(yè),與機(jī)器人結(jié)合之后,人類開(kāi)啟了對(duì)通用機(jī)器人可能性的新想象:只能聊天對(duì)話太局限了,能不能通過(guò)指令,自己拆解任務(wù)并執(zhí)行到底?

云啟資本合伙人陳昱認(rèn)為,大模型本質(zhì)是軟件能力,在數(shù)字世界中,與現(xiàn)實(shí)世界連接最好的載體實(shí)際上是硬件載體?!澳壳埃覀兏粗厝绾螌⒋竽P团c機(jī)器人硬件結(jié)合,實(shí)現(xiàn)通用機(jī)器人的形態(tài)?!痹谒磥?lái),具身智能讓通用機(jī)器人已經(jīng)看到了一個(gè)可能的路徑,資本就是去給行業(yè)添一把柴火,經(jīng)過(guò)五年到十年的大規(guī)模的投入,讓它燒的更旺,最終實(shí)現(xiàn)通用機(jī)器人的商用化。

陳昱提到,目前機(jī)器人側(cè)研發(fā)關(guān)注的重點(diǎn)與以往不同:不再僅限于完成某一類特定工作,而是進(jìn)一步完成多類型任務(wù)。比如過(guò)去,配送機(jī)器人負(fù)責(zé)配送、建筑機(jī)器人智能刷墻。但在通用智能化的大背景下,未來(lái)將有可能實(shí)現(xiàn)機(jī)器人靈活用工,比如工廠環(huán)境中的機(jī)器人既能擰螺絲、又能噴漆、還能完成零件組裝。

目前,不管是“具身智能”還是“通用人工智能”都是市場(chǎng)對(duì)2023年的人形機(jī)器人的新期待——通用人工智能對(duì)物理世界的價(jià)值需要有具身的實(shí)體來(lái)承載,并和真實(shí)的物理世界進(jìn)行交互,才能更大范圍的影響人類。

線性資本投資總監(jiān)辛未認(rèn)為,大模型打開(kāi)了通用機(jī)器人的可實(shí)現(xiàn)性。辛未提到,機(jī)器人的通用化,需要解決幾個(gè)技術(shù)的問(wèn)題:上層需要對(duì)任務(wù)做理解、定義、規(guī)劃、拆分;中間需要能夠強(qiáng)泛化的執(zhí)行層來(lái)滿足不同場(chǎng)景的任務(wù)執(zhí)行;底層是相對(duì)成熟的機(jī)器人控制,再搭配上合適的硬件本體。“三個(gè)層級(jí)中,在大模型出來(lái)之前,我們認(rèn)為頂層是最難實(shí)現(xiàn)的,而大模型的能力完全匹配了這一層的要求,使通用機(jī)器人具有變?yōu)楝F(xiàn)實(shí)的可能?!?/p>

很多創(chuàng)業(yè)公司看中的也是技術(shù)驅(qū)動(dòng)下,人形機(jī)器人的新能力可能會(huì)打開(kāi)全新的需求,更靠近落地。

宇樹(shù)科技創(chuàng)始人王興興提到,在幾年前,市場(chǎng)不看好人形機(jī)器人最關(guān)鍵的原因是,人類的控制技術(shù)沒(méi)辦法駕馭人形機(jī)器人這么復(fù)雜的機(jī)器人形態(tài)。如今,在大模型的技術(shù)發(fā)展下,AI的發(fā)展已經(jīng)遠(yuǎn)超機(jī)器人需要的技術(shù)?!艾F(xiàn)在做人形機(jī)器人,借鑒現(xiàn)有的大模型技術(shù),做一個(gè)小模型甚至中等模型就能用了,這讓通用人形機(jī)器人技術(shù)層面邁過(guò)了一個(gè)鴻溝,未來(lái)幾年,只要突破工程方面的問(wèn)題,就可以讓人形機(jī)器人可以發(fā)揮很大的生產(chǎn)價(jià)值,帶來(lái)顛覆性的落地應(yīng)用?!?/p>

正在研究雙足機(jī)器人的智能機(jī)器人公司逐際動(dòng)力創(chuàng)始人張巍認(rèn)為,人形機(jī)器人帶來(lái)的機(jī)器人通用機(jī)會(huì)在于,既可以解決目前專業(yè)機(jī)器無(wú)法處理的問(wèn)題,同時(shí)需要具備至少2-3個(gè)不同工種工人的能力,比如既能搬箱子,還可以揀貨、進(jìn)行質(zhì)量檢測(cè)等,它需要是一個(gè)通用的物理運(yùn)動(dòng)平臺(tái)。

相比國(guó)內(nèi),國(guó)外的進(jìn)展更快一步,已經(jīng)把大模型的能力從語(yǔ)言穿透到執(zhí)行層。

今年7月,李飛飛團(tuán)隊(duì)在網(wǎng)上公開(kāi)了一個(gè)新的具身智能研究項(xiàng)目:接入大模型的機(jī)器人可以根據(jù)人類發(fā)出的語(yǔ)言指令,自己進(jìn)行拉抽屜、擰瓶蓋、稱重蘋果等動(dòng)作。

7月28日,谷歌DeepMind最推出的機(jī)器人模型Robotics Transformer 2(RT-2)也是這一方向研究的延伸。RT-2是一個(gè)全新的視覺(jué)-語(yǔ)言-動(dòng)作(VLA)模型,可以從網(wǎng)絡(luò)和機(jī)器人數(shù)據(jù)中學(xué)習(xí),并將這些知識(shí)轉(zhuǎn)化為機(jī)器人控制的通用指令。RT-2表現(xiàn)出了更好的泛化能力——理解范圍超出它所接觸到的機(jī)器人數(shù)據(jù)的語(yǔ)義和視覺(jué)范疇,且能解釋新指令并通過(guò)執(zhí)行基本推理來(lái)響應(yīng)用戶命令。

Google DeepMind的論文中介紹了Robotics Transformer 2(RT-2),一個(gè)全新的視覺(jué)-語(yǔ)言-動(dòng)作(VLA)模型,它從網(wǎng)絡(luò)和機(jī)器人數(shù)據(jù)中學(xué)習(xí),并將這些知識(shí)轉(zhuǎn)化為機(jī)器人控制的通用指令,同時(shí)保留了web-scale能力。

這些研究都為人類邁向通用機(jī)器人奠定了關(guān)鍵一步。國(guó)內(nèi),來(lái)自清華的團(tuán)隊(duì)也一直進(jìn)行這一領(lǐng)域的研究。2000年圖靈獎(jiǎng)獲得者、中國(guó)科學(xué)院院士、清華大學(xué)交叉信息研究院院長(zhǎng)姚期智在論壇分享中提到,這種融合了大模型能力的新一代具身智能體需要具備三個(gè)特征:

第一是身體,這部分需要有足夠的硬件,比如傳感器和執(zhí)行器;

第二是小腦,可以主導(dǎo)視覺(jué)、觸覺(jué)各種感知,來(lái)控制身體,完成復(fù)雜的任務(wù);

第三是大腦,主導(dǎo)上層的邏輯推理、決策、長(zhǎng)時(shí)間的規(guī)劃,并以用自然語(yǔ)言和其他的智能體、環(huán)境交流。

如果具身智能為核心的通用機(jī)器人是未來(lái)方向,這個(gè)形態(tài)為什么一定是人形機(jī)器人?

誠(chéng)然,通用機(jī)器人不一定等于人形機(jī)器人,但目前,很多機(jī)器人從業(yè)者都提到,人形機(jī)器人是公認(rèn)的最好的通用機(jī)器人形態(tài)。

姚期智在分享中提到,目前,最好的通用機(jī)器人形態(tài)就是人形機(jī)器人,一方面人形機(jī)器人更能適應(yīng)各種環(huán)境,另一方面,當(dāng)前人類社會(huì)環(huán)境中的種種設(shè)計(jì)都是為人類量身定做,比如樓梯結(jié)構(gòu)、門把手高度、杯子形狀等,都是為人類形象所定制。所以,如果要打造一個(gè)有泛應(yīng)用能力的通用機(jī)器人,人形是目前最好最適合的形態(tài)。

真格基金合伙人劉元告訴「甲子光年」,他認(rèn)為,人形機(jī)器人的產(chǎn)品定義和需求是有基礎(chǔ)的,它在某種程度上與人類數(shù)百年前對(duì)機(jī)器人的期待就有些相似。縱觀歷史中各類技術(shù)的發(fā)展,很多新的產(chǎn)品都是對(duì)幾百年前人類科幻作品中對(duì)未來(lái)生活的需求和解決方案的一種遙遠(yuǎn)回響?!皫装倌昵?,人類就想讓機(jī)器人幫做家務(wù)。之后就有了洗衣機(jī)、微波爐、掃地機(jī)器人??梢哉f(shuō),科幻完成了人類對(duì)于需求的一個(gè)產(chǎn)品定義?!?/p>

但他也提到,這個(gè)階段很多公司一擁而上做人形機(jī)器人也有很大的跟風(fēng)成分。

3.大模型解決不了的問(wèn)題還有很多

理想豐滿的另一面是現(xiàn)實(shí)的骨感。對(duì)于正加速布局人形機(jī)器人賽道的科技公司而言,在把握當(dāng)前機(jī)會(huì)的同時(shí)還要考慮更多現(xiàn)實(shí)的技術(shù)難題和商業(yè)化挑戰(zhàn)。

技術(shù)層面,正如谷歌、李飛飛等團(tuán)隊(duì)正在研究的一樣,通用機(jī)器人領(lǐng)域也需要類似GPT-4這樣的大模型,能夠真正一步到位,把多模式能力融合在一起,真正統(tǒng)一具身智能的發(fā)展。

但這并非易事,明勢(shì)資本合伙人夏令告訴「甲子光年」,目前論文和一些demo展示的機(jī)器人與大語(yǔ)言模型結(jié)合偏重交互問(wèn)題,但并不是解決交互問(wèn)題后,人形機(jī)器人就變成了通用機(jī)器人?!耙?yàn)榧词够谌藱C(jī)交互完成高層次任務(wù)分解和規(guī)劃,機(jī)器人仍需要控制和執(zhí)行,包括在復(fù)雜地形的通用移動(dòng)能力和高精度操作能力。這些能力對(duì)機(jī)器人來(lái)說(shuō)仍有很大挑戰(zhàn)。”

夏令認(rèn)為,在控制執(zhí)行層面,大語(yǔ)言模型難以解決問(wèn)題?!罢驹谡麄€(gè)通用機(jī)器人的發(fā)展角度來(lái)看,大語(yǔ)言模型有貢獻(xiàn),但對(duì)底層控制和執(zhí)行的影響有限。目前學(xué)術(shù)界采用AI驅(qū)動(dòng)的方法,希望把強(qiáng)化學(xué)習(xí)的方式做底層的控制執(zhí)行,但這和大語(yǔ)言模型并沒(méi)有直接的關(guān)系。且強(qiáng)化學(xué)習(xí)的控制方法大部分還停留在學(xué)術(shù)研究階段?!?/p>

身在其中的企業(yè)也正在面對(duì)這些難題。宇樹(shù)科技創(chuàng)始人王興興提到,機(jī)器人領(lǐng)域會(huì)出現(xiàn)自身的大模型。在他看來(lái),大模型與機(jī)器人的融合是一個(gè)難點(diǎn),一些通用大模型并的文字邏輯化和處理能力不錯(cuò),但由于不是給通用人形機(jī)器人專門使用,所以這些大模型對(duì)環(huán)境認(rèn)知和感知能力基本是零。而不同于大語(yǔ)言模型的數(shù)據(jù)集可以直接從互聯(lián)網(wǎng)端獲取,機(jī)器人的數(shù)據(jù)都是動(dòng)態(tài)的數(shù)據(jù)集,需要在仿真環(huán)境中,獲得動(dòng)態(tài)模擬數(shù)據(jù),也依賴于和物理環(huán)境的基礎(chǔ)和交互,這些都需要一定的時(shí)間。

對(duì)于未來(lái)的技術(shù)進(jìn)展,王興興相對(duì)比較樂(lè)觀,“目前英偉達(dá)已經(jīng)在推進(jìn)在仿真環(huán)境中的相關(guān)訓(xùn)練,從目前全球的熱度以及目前人工智能行業(yè)的進(jìn)展來(lái)看,不超過(guò)10年,會(huì)有顯著性進(jìn)步?!?/p>

也有人覺(jué)得不會(huì)很快。德國(guó)慕尼黑工業(yè)大學(xué)教授Alois C. Knoll提到,接下來(lái),機(jī)器人領(lǐng)域也需要慢慢的像大語(yǔ)言模型一樣,一步步的集成仿真、建模、編程、人工智能等多項(xiàng)能力,走出自身的智能泛化能力?!叭诵螜C(jī)器人是目前見(jiàn)到的最難最復(fù)雜的機(jī)器之一,這個(gè)過(guò)程需要時(shí)間,可能會(huì)比AGI慢,可能不會(huì)快速地見(jiàn)到巨變?!?/p>

另一個(gè)關(guān)鍵的挑戰(zhàn)在于軟硬件能力的協(xié)同進(jìn)化上。

與很多人都在推崇大模型給人形機(jī)器人帶來(lái)顛覆性的機(jī)會(huì)不同,波士頓動(dòng)力創(chuàng)始人Marc Raibert在演講中提到,未來(lái)的機(jī)器人技術(shù)發(fā)展過(guò)程中,硬件工程和軟件同等重要?!坝行┤苏J(rèn)為軟件可以克服硬件上所有的問(wèn)題和限制,我并不贊同這個(gè)觀點(diǎn)”。

在他看來(lái),只有最好的硬件設(shè)計(jì)師和軟件性設(shè)計(jì)師傾力合作,才能夠設(shè)計(jì)出世界上最好的機(jī)器人。以波士頓動(dòng)力的人形機(jī)器人為例,在Atlas的硬件工程方面,公司做了大量工作——包括液壓系統(tǒng)、多個(gè)專門的閥門、專用電池、負(fù)載等各個(gè)方面,把機(jī)器人的重量從170公斤縮小到90公斤,這個(gè)過(guò)程中,他們沒(méi)有在機(jī)器人的功能上有任何妥協(xié),反而提高了機(jī)器人的運(yùn)動(dòng)范圍力量和速度。

這是目前最現(xiàn)實(shí)的難點(diǎn)。尤其對(duì)于創(chuàng)業(yè)公司而言,平衡技術(shù)實(shí)現(xiàn)、性能和成本是關(guān)鍵能力。

星動(dòng)紀(jì)元CEO陳建宇稱,目前星動(dòng)紀(jì)元希望機(jī)器人能同時(shí)兼顧力量、速度、精度以及成本,但確實(shí)難以做到?!耙簤杭夹g(shù)能讓機(jī)器人的速度和力量都很強(qiáng),但成本太貴;電驅(qū)動(dòng)技術(shù)取決于如果用高減速比的諧波技術(shù),但一旦精度比較高,承載也不錯(cuò),靈巧性又會(huì)降低;而靈巧度上去了,成本比較低,但卻要犧牲機(jī)器人的載荷和精度?,F(xiàn)在很難兼顧所有情況,只能針對(duì)不同的應(yīng)用場(chǎng)景,進(jìn)行各要素的平衡?!?/p>

此外,在安全性上,大語(yǔ)言模型胡說(shuō)八道可能造成的影響不大,但一旦一臺(tái)搭載大模型的機(jī)器人進(jìn)入生活,就需要保證準(zhǔn)確度和安全性,這些都是技術(shù)需要改進(jìn)的方向。

這些問(wèn)題都需要人形機(jī)器人公司需在場(chǎng)景中不斷試錯(cuò)才能找到解題思路。

線性資本投資總監(jiān)辛未告訴「甲子光年」:人形機(jī)器人目前可展示的 demo 都相對(duì)初級(jí),無(wú)論是移動(dòng)還是操作,在場(chǎng)景端真正用起來(lái)需要算法和硬件有強(qiáng)泛化性,這是其商業(yè)化的基礎(chǔ),目前人形還有科學(xué)側(cè)的問(wèn)題沒(méi)有解決?!爱?dāng)然,我們既不能高估技術(shù)的短期效應(yīng),也不能忽視技術(shù)的長(zhǎng)期進(jìn)步,通用機(jī)器人已經(jīng)變成大火的領(lǐng)域,無(wú)論是學(xué)術(shù)側(cè)還是工業(yè)側(cè),更多的力量和資源涌入,我相信能在一定程度落地的商業(yè)化產(chǎn)品不遠(yuǎn)了?!?/p>

明勢(shì)資本合伙人夏令認(rèn)為,對(duì)于今天想去做通用機(jī)器人的創(chuàng)業(yè)公司而言,類比自動(dòng)駕駛的發(fā)展,找到可商業(yè)化閉環(huán)和可數(shù)據(jù)閉環(huán)的L2尤其重要。因?yàn)樗哂姓鎸?shí)的商業(yè)化價(jià)值,同時(shí)底層技術(shù)能夠在商業(yè)化價(jià)值實(shí)現(xiàn)的基礎(chǔ)上,實(shí)現(xiàn)數(shù)據(jù)飛輪,支持繼續(xù)向L4的方向去發(fā)展?!叭绻阒挥蠰2,沒(méi)有去做L4的技術(shù)架構(gòu)、野心及能力也是不行的。所以就是要心懷著一個(gè)L4偉大的夢(mèng)想,同時(shí)要腳踏實(shí)地找到一個(gè)可商業(yè)化的L2?!?/p>

技術(shù)、場(chǎng)景、成本、安全,機(jī)會(huì)和挑戰(zhàn)正在同時(shí)到來(lái),人形機(jī)器人正邁出了通往未來(lái)的關(guān)鍵一步。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 機(jī)器人
    +關(guān)注

    關(guān)注

    210

    文章

    28127

    瀏覽量

    205889
  • 自動(dòng)駕駛
    +關(guān)注

    關(guān)注

    782

    文章

    13632

    瀏覽量

    165989
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    2284

    瀏覽量

    2372

原文標(biāo)題:人形機(jī)器人+大模型,為什么是投資人追逐的新風(fēng)口?|甲子光年

文章出處:【微信號(hào):jazzyear,微信公眾號(hào):甲子光年】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    王耀南院士:AI大模型賦能人形機(jī)器人及未來(lái)趨勢(shì)

    近日,中國(guó)工程院院士、機(jī)器人視覺(jué)感知與控制技術(shù)國(guó)家工程研究中心主任、湘江時(shí)代機(jī)器人研究院院長(zhǎng)王耀南作了題為《AI大模型驅(qū)動(dòng)的人形機(jī)器人與展望
    的頭像 發(fā)表于 11-08 11:03 ?380次閱讀
    王耀南院士:AI大<b class='flag-5'>模型</b>賦能<b class='flag-5'>人形</b><b class='flag-5'>機(jī)器人</b>及未來(lái)趨勢(shì)

    人形機(jī)器人場(chǎng)景應(yīng)用聯(lián)盟正式成立

    日前,在“2024首屆人形機(jī)器人場(chǎng)景應(yīng)用峰會(huì)”上,人形機(jī)器人場(chǎng)景應(yīng)用聯(lián)盟正式宣告成立。
    的頭像 發(fā)表于 08-19 11:17 ?586次閱讀

    模型助陣,人形機(jī)器人打工潮來(lái)了?

    理論到實(shí)踐中,如何真正體現(xiàn)數(shù)字孿生的技術(shù)威力并獲得業(yè)務(wù)價(jià)值,其中的經(jīng)驗(yàn)或成為推進(jìn)其進(jìn)一步廣泛應(yīng)用的關(guān)鍵。人形機(jī)器人酷炫的外表讓對(duì)未來(lái)世界滿懷憧憬。今天,如果人形
    的頭像 發(fā)表于 08-13 09:35 ?793次閱讀
    大<b class='flag-5'>模型</b>助陣,<b class='flag-5'>人形</b><b class='flag-5'>機(jī)器人</b>打工潮來(lái)了?

    NVIDIA 加速人形機(jī)器人發(fā)展

    —SIGGRAPH— 當(dāng)?shù)貢r(shí)間 2024 年 7 月 29 日— 為加速全球人形機(jī)器人的發(fā)展,NVIDIA 于今日宣布,為全球領(lǐng)先的機(jī)器人制造商、AI 模型開(kāi)發(fā)者和軟件制造商提供一套
    發(fā)表于 07-30 09:15 ?706次閱讀
    NVIDIA 加速<b class='flag-5'>人形</b><b class='flag-5'>機(jī)器人</b>發(fā)展

    Al大模型機(jī)器人

    金航標(biāo)kinghelm薩科微slkor總經(jīng)理宋仕強(qiáng)介紹說(shuō),薩科微Al大模型機(jī)器人有哪些的優(yōu)勢(shì)?薩科微AI大模型機(jī)器人由清華大學(xué)畢業(yè)的天才少年N博士和王博士團(tuán)隊(duì)開(kāi)發(fā),與同行相比具有許多優(yōu)
    發(fā)表于 07-05 08:52

    為何要做人形機(jī)器人

    人形機(jī)器人在各個(gè)發(fā)展時(shí)期,都致力于在“仿特征”上有一些突破。盡管有的人形機(jī)器人穿上衣服可以達(dá)到“以假亂真”的程度,但仔細(xì)觀察就不難發(fā)現(xiàn),幾
    發(fā)表于 04-09 10:54 ?475次閱讀

    優(yōu)必選宣布人形機(jī)器人Walker S接入百度文心大模型

    優(yōu)必選宣布人形機(jī)器人Walker S接入百度文心大模型,共同探索中國(guó)AI大模型+人形機(jī)器人的應(yīng)用
    的頭像 發(fā)表于 04-07 10:17 ?840次閱讀

    華為云在人形機(jī)器人領(lǐng)域展開(kāi)合作

    華為云與人形機(jī)器人領(lǐng)域的創(chuàng)新企業(yè)樂(lè)聚機(jī)器人近日達(dá)成合作,共同致力于探索“華為盤古大模型+夸父人形機(jī)器人
    的頭像 發(fā)表于 03-25 10:49 ?564次閱讀

    華為云攜手樂(lè)聚機(jī)器人,共探人形機(jī)器人智能新紀(jì)元

    近日,華為云計(jì)算技術(shù)有限公司與樂(lè)聚(深圳)機(jī)器人技術(shù)有限公司正式簽署戰(zhàn)略合作協(xié)議,標(biāo)志著雙方將共同開(kāi)拓“華為盤古大模型+夸父人形機(jī)器人”的全新應(yīng)用場(chǎng)景。此舉不僅是華為云在
    的頭像 發(fā)表于 03-25 10:17 ?546次閱讀

    英偉達(dá)發(fā)布人形機(jī)器人基礎(chǔ)模型

    英偉達(dá)在一年一度的GTC開(kāi)發(fā)者大會(huì)上,由創(chuàng)始黃仁勛親自揭曉了令人矚目的Project GR00T人形機(jī)器人項(xiàng)目,其中引人注目的是一款全新的人形機(jī)器
    的頭像 發(fā)表于 03-21 11:43 ?694次閱讀

    人形機(jī)器人火熱 OpenAI入局人形機(jī)器人 英偉達(dá)等巨頭入局機(jī)器人行業(yè)

    科技巨頭關(guān)注。 據(jù)外媒報(bào)道英偉達(dá)、微軟、OpenAI、三星、亞馬遜等科技巨頭大手筆投資人形機(jī)器人初創(chuàng)公司FigureAI,F(xiàn)igure計(jì)劃在融資中籌集約6.75億美元,貝佐斯計(jì)劃投資1億美元。微軟將
    的頭像 發(fā)表于 02-26 17:21 ?736次閱讀

    曝貝佐斯和英偉達(dá)投資Figure人形機(jī)器人 超大手筆投資

    ,但是巨頭的大手筆入局或?qū)⑾破?b class='flag-5'>人形機(jī)器人的革命。 Figure吸引了超級(jí)豪華的投資人,比如OpenAI和微軟;還有英特爾、亞馬遜、三星等。 Figure計(jì)劃在融資中籌集約6.75億美元,貝佐斯計(jì)劃
    的頭像 發(fā)表于 02-25 14:37 ?834次閱讀

    人形機(jī)器人成為車圈“新寵”?

    現(xiàn)在的人形機(jī)器人不僅形態(tài)更接近人類,而且具備更多的智慧。隨著大型AI模型的不斷推進(jìn),人工智能正在加速人形通用機(jī)器人的量產(chǎn)和落地。
    發(fā)表于 02-22 09:22 ?370次閱讀
    <b class='flag-5'>人形</b><b class='flag-5'>機(jī)器人</b>成為車圈“新寵”?

    高動(dòng)態(tài)人形機(jī)器人“夸父”通過(guò)OpenHarmony 3.2 Release版本兼容性測(cè)評(píng)

    近日, 搭載KaihongOS的“夸父”人形機(jī)器人通過(guò)OpenAtom OpenHarmony(以下簡(jiǎn)稱“OpenHarmony”)3.2 Release版本兼容性測(cè)評(píng)并獲頒兼容性證書 。這體現(xiàn)了
    發(fā)表于 12-20 09:31

    劍指人形機(jī)器人賽道,泰科機(jī)器人推出重磅關(guān)節(jié)模組

    泰科機(jī)器人幾年前就研判人形機(jī)器人賽道將會(huì)成為熱點(diǎn),決定研發(fā)人形機(jī)器人適用的關(guān)節(jié)模組,經(jīng)過(guò)艱苦的技術(shù)攻堅(jiān),泰科
    的頭像 發(fā)表于 11-22 11:12 ?679次閱讀
    劍指<b class='flag-5'>人形</b><b class='flag-5'>機(jī)器人</b>賽道,泰科<b class='flag-5'>機(jī)器人</b>推出重磅關(guān)節(jié)模組