“野生鋼鐵俠”、“華為天才少年”、“年薪百萬(wàn)離職創(chuàng)業(yè)”——頭戴這些傳奇光環(huán)的稚暉君,帶來(lái)了其創(chuàng)業(yè)以來(lái)的產(chǎn)品首秀。
智元具身智能機(jī)器人 “遠(yuǎn)征 A1”重磅發(fā)布!
從開(kāi)場(chǎng)前的彈幕來(lái)看,大多數(shù)人都期待滿滿~
稚暉君登場(chǎng)后(還有點(diǎn)小緊張),用30分鐘的時(shí)間帶給了大家一段全程干貨的演講。
據(jù)介紹,智能機(jī)器人 “遠(yuǎn)征 A1”融合了各種先進(jìn)的本體控制、感知、認(rèn)知和決策智能技術(shù),基于當(dāng)前 AI 領(lǐng)域非常前沿的大語(yǔ)言模型,以及其自研的視覺(jué)控制模型等一系列創(chuàng)新技術(shù),將擁有出色的智能交互和任務(wù)執(zhí)行能力,未來(lái)可以在各種復(fù)雜場(chǎng)景下自主完成各種移動(dòng)和操作。
這場(chǎng)發(fā)布會(huì),也是稚暉君創(chuàng)業(yè)公司——智元機(jī)器人(Agibot)品牌的首次對(duì)外露出。
為什么要用這個(gè)名字?因?yàn)椤爸恰贝?a href="http://ttokpm.com/v/tag/150/" target="_blank">人工智能,“元”則是下方有兩條腿的人的象形,其英文名Agibot是通用人工智能機(jī)器人的意思。
所以,智元機(jī)器人(Agibot)這家公司的初心&使命就是“創(chuàng)造出和人一樣靈活以及智能的機(jī)器人,讓智能機(jī)器創(chuàng)造無(wú)限生產(chǎn)力”,最終推動(dòng)人類整個(gè)社會(huì)邁向一個(gè)更加智能、高效和可持續(xù)的未來(lái)。
發(fā)布會(huì)最后,機(jī)器人本體也登上了舞臺(tái),為這次首秀落下了完美的帷幕。
“遠(yuǎn)征 A1”到底有多牛?
網(wǎng)上有個(gè)經(jīng)典的AI段子,如下圖所示:
我們想讓AI做飯、打掃房間、洗衣服晾衣服曬衣服、扔垃圾、鏟屎等,但是AI實(shí)際在做的事卻是聊天、繪畫、寫作、作曲和游戲等等……
要想讓機(jī)器人真正去做圖上左邊的事情,必須實(shí)現(xiàn)AI和機(jī)器人技術(shù)更深層次的結(jié)合,這涉及到對(duì)環(huán)境的理解、上下文的推理、物體識(shí)別、運(yùn)動(dòng)規(guī)劃等一系列復(fù)雜的技術(shù)挑戰(zhàn)——這并不是一個(gè)硬件或者軟件的問(wèn)題,它是一個(gè)系統(tǒng)性的軟硬件算法各方面綜合的協(xié)同問(wèn)題。
為此,智元團(tuán)隊(duì)在軟件和硬件方面都取得了階段性的進(jìn)展。
人形機(jī)器人本體技術(shù)
首先來(lái)看硬件部分,也就是人形機(jī)器人本體技術(shù)。
為什么是人形?
答案其實(shí)很簡(jiǎn)單,因?yàn)槿祟惿畹恼麄€(gè)物理世界就是為人的形態(tài)而設(shè)計(jì)的,包括各種場(chǎng)景、任務(wù)、設(shè)備、工具都是為人類量身打造的,所以人形的身體結(jié)構(gòu)和能力顯然可以幫助機(jī)器人更好地融入人類生活的環(huán)境。
當(dāng)然,稚暉君也承認(rèn)——
人形并不是通用機(jī)器人唯一的解決方案,在一些特定的結(jié)構(gòu)化場(chǎng)景中,可能其他平臺(tái)的機(jī)器人會(huì)有更高的效率和可用性,所以他們也對(duì)機(jī)器人本體進(jìn)行了各種模塊化的設(shè)計(jì)。
但長(zhǎng)遠(yuǎn)來(lái)看,從第一性原理出發(fā),稚暉君的團(tuán)隊(duì)還是認(rèn)為人形機(jī)器人是在人類環(huán)境中最為通用的一種形態(tài),也是未來(lái)可以走進(jìn)千家萬(wàn)戶,有希望進(jìn)入大家生活中的最終的終極形態(tài)。
為了實(shí)現(xiàn)機(jī)器人流暢的基礎(chǔ)行走能力和上下協(xié)同能力,在本體硬件設(shè)計(jì)方面,智元團(tuán)隊(duì)在機(jī)器人全身搭載了包括諧波一體關(guān)節(jié)、直線推桿、無(wú)刷行星伺服、空心杯電機(jī)等在內(nèi)一共49個(gè)自由度,各類的執(zhí)行器。
一臺(tái)行動(dòng)非常精準(zhǔn)靈敏的機(jī)器人,它的關(guān)節(jié)需要具備一系列特征:體積小、重量輕、功率密度足夠高、能量利用效率足夠高、高響應(yīng)帶寬、耐沖擊等等…..
然后再結(jié)合機(jī)器人整機(jī)結(jié)構(gòu)設(shè)計(jì)和控制系統(tǒng)的最優(yōu)設(shè)計(jì),才能保障其執(zhí)行的高效。
所以這個(gè)核心關(guān)節(jié)它不僅是讓人形機(jī)器人更加靈活,更加自由的關(guān)鍵,那也同時(shí)也是未來(lái)智元想要實(shí)現(xiàn)規(guī)模量產(chǎn)化,實(shí)現(xiàn)低成本制造的重要門檻之一。
為此,智元團(tuán)隊(duì)自研設(shè)計(jì)了名為PowerFlow的專用關(guān)節(jié),重量?jī)H為1.6kg,小小的體積下集成了液冷循環(huán)散熱系統(tǒng),峰值扭矩可達(dá)350Nm。
另外一個(gè)非常重要的核心零部件就是零巧手。
智元團(tuán)隊(duì)自研了高自由度的靈巧手,目前擁有12個(gè)主動(dòng)自由度和5個(gè)被動(dòng)自由度,而且所有驅(qū)動(dòng)都是內(nèi)置的,成本卻可以低至1萬(wàn)元以內(nèi)。
同時(shí),因?yàn)锳1機(jī)器人應(yīng)用將瞄準(zhǔn)一些非常精密的操作場(chǎng)景,所以該款靈巧手的指尖也集成了基于視覺(jué)的指尖傳感器,可以分辨操作物的顏色、形狀,甚至材質(zhì),而且可以基于各種算法的數(shù)據(jù)融合,去做到近似觸覺(jué)壓力傳感器的感知效果。
除了這兩個(gè)核心零部件之外,遠(yuǎn)征A1身上還搭載了一系列的感知元件和算力系統(tǒng),以及配套的具身智能框架。所有這些零部件的高效組合和組織運(yùn)作,使得它成為了一臺(tái)智慧高超、肢體強(qiáng)勁的機(jī)器人開(kāi)發(fā)平臺(tái)。
有了非常良好的硬件平臺(tái)作為基礎(chǔ),運(yùn)控算法也是非常核心的關(guān)鍵。據(jù)稚暉君介紹,在短短幾個(gè)月的研發(fā)實(shí)踐中,其團(tuán)隊(duì)已經(jīng)快速迭代了三版運(yùn)控算法,可以說(shuō)其已經(jīng)擁有目前業(yè)界一梯隊(duì)的最核心的算法研發(fā)能力。
為了讓遠(yuǎn)征AI具備真正落地的可能,智元團(tuán)隊(duì)希望未來(lái)將整個(gè)機(jī)器人硬件成本控制在20萬(wàn)元人民幣以內(nèi),也不知手握擎天柱機(jī)器人的馬斯克慌不慌。
具身智能技術(shù)
機(jī)器人要想低成本的量產(chǎn)并產(chǎn)生實(shí)際應(yīng)用價(jià)值,硬件本體只是前置條件,更重要的則是機(jī)器人的AI大腦,也就是軟件部分。
近年來(lái),隨著大語(yǔ)言模型技術(shù)的飛速發(fā)展,稚暉君認(rèn)為讓機(jī)器人自主去感知環(huán)境,理解任務(wù)動(dòng)作編排,自主地去完成一整套流程已經(jīng)成為了可能。
在智元團(tuán)隊(duì)看來(lái),大模型在機(jī)器人領(lǐng)域運(yùn)用最大的價(jià)值體現(xiàn)在兩點(diǎn):
第一點(diǎn)是“龐大的先驗(yàn)知識(shí)庫(kù)&強(qiáng)大的通識(shí)理解能力”。
舉例而言,當(dāng)我們需要讓機(jī)器人把桌子上的垃圾扔到旁邊的垃圾桶里,我們不再需要去告訴他垃圾是啥,垃圾桶是啥。所有的這些數(shù)據(jù),都是預(yù)訓(xùn)練的 GPT 模型從海量物聯(lián)網(wǎng)數(shù)據(jù)中已經(jīng)學(xué)到的概念,所以大模型的出現(xiàn)可以使得機(jī)器人把原有的能力更好地泛化到它沒(méi)有見(jiàn)過(guò)的場(chǎng)景中。
第二點(diǎn)是“復(fù)雜語(yǔ)義多級(jí)推理能力,所謂的思維鏈”。
如下圖所示,如果我們需要指令機(jī)器人將“藍(lán)色的方塊放在紅色方塊下面”,那么機(jī)器人就得理解重力是怎么回事,因?yàn)闁|西不會(huì)飄在空中,他要怎么進(jìn)行一個(gè)多級(jí)的操作來(lái)完成這樣一個(gè)復(fù)雜的任務(wù)?
所以在大模型時(shí)代到來(lái)之前,機(jī)器人都是專用設(shè)備,我們需要針對(duì)性地對(duì)每一個(gè)任務(wù)進(jìn)行調(diào)試和部署,而如今利用大模型的各種通識(shí)能力和舉一反三的推理能力,我們可以看到解決這些問(wèn)題,最終走向通用機(jī)器人的一道曙光。
基于此,智元設(shè)置了“具身智腦”EI-Brain框架,把機(jī)器人的思維系統(tǒng)分為四個(gè)層級(jí),分別是云端超腦、大腦、小腦和腦干。
講完技術(shù)后,稚暉君也用一段視頻展示了人形機(jī)器人在各個(gè)場(chǎng)景里面應(yīng)用的無(wú)限潛力。
據(jù)悉,“遠(yuǎn)征A1”將首先用于新能源制造、3C制造,目前已經(jīng)與頭部企業(yè)進(jìn)行對(duì)接。但具體品牌名,尚未透露。
“天才少年”離職創(chuàng)業(yè)史
公開(kāi)資料顯示:稚暉君,真名彭志輝,2018年畢業(yè)于電子科技大學(xué)信通學(xué)院。
2018年畢業(yè)后,他曾就職于OPPO研究院AI實(shí)驗(yàn)室擔(dān)任算法工程師,后受邀通過(guò)天才少年計(jì)劃加入華為,從事昇騰AI芯片和AI算法相關(guān)研究工作,年薪百萬(wàn)。
能加入“華為天才少年計(jì)劃”,就已經(jīng)很能說(shuō)明其實(shí)力之牛了。該計(jì)劃對(duì)申請(qǐng)者具有極高的要求:國(guó)際頂刊論文發(fā)表數(shù)量及引用量豐富者;研究方向有出色及豐富的商業(yè)化成果;有知名賽事名次者優(yōu)先。與之相對(duì)的招聘流程亦非常嚴(yán)格,一般需要經(jīng)歷7輪左右流程,最終還要通過(guò)華為總裁的面試。
與其他那些神秘天才不同,稚暉君是一位活躍于網(wǎng)絡(luò)的大V,他所做的許多研究也都公布在了網(wǎng)上,相信不少科技愛(ài)好者都在B站上刷到過(guò)他的視頻。
比如這輛硬核自行車,它不但能夠自己穩(wěn)穩(wěn)站立,還能夠自動(dòng)行走、躲避障礙物,甚至還能自己拐彎……
還有這臺(tái)鋼鐵俠的機(jī)械臂,稚暉君遠(yuǎn)程操控其為一顆破口葡萄縫針,葡萄未被機(jī)械臂損壞。
在“葡萄包扎術(shù)”后,原本裂開(kāi)小口的它,變成了這個(gè)樣子:
以及稚暉君“鴿”到今年4月在B站分享自制的“輪足”機(jī)器人哪吒,簡(jiǎn)直就是“國(guó)風(fēng)神話”和“賽博機(jī)械”的組合~
網(wǎng)友驚嘆稚暉君的恐怖之處在于:一個(gè)人完成了所有細(xì)節(jié),建模,算法,電路設(shè)計(jì),驅(qū)動(dòng)設(shè)計(jì),APP開(kāi)發(fā),知識(shí)儲(chǔ)備量和動(dòng)手實(shí)踐能力恐怖如斯!
完成了許多創(chuàng)舉的稚暉君本身則比較謙虛,他自己在很多采訪里都表達(dá)過(guò)“我覺(jué)得我既不是天才,也已經(jīng)不是少年了”,自己只是個(gè)很愛(ài)折騰的極客而已。
去年12月,稚暉君正式確認(rèn)離開(kāi)華為,表示自己接下來(lái)會(huì)開(kāi)啟一段新的事業(yè)。雖然華為內(nèi)部也曾挽留,但顯然這種級(jí)別的天才是很難在大廠做一顆“螺絲釘”的。
今年2月,稚暉君的創(chuàng)業(yè)公司智元機(jī)器人(Agibot)正式成立。
據(jù)悉,智元機(jī)器人(Agibot)是一家專注于發(fā)展通用人形機(jī)器人和具身智能的公司,致力于以A1和機(jī)器人的深度融合,長(zhǎng)期投入打造有競(jìng)爭(zhēng)力的機(jī)器人產(chǎn)品和生態(tài)。
截至目前,智元機(jī)器人(Agibot)已經(jīng)完成了第三輪融資,市場(chǎng)估值被曝在十幾億美元左右。
幾個(gè)月前,稚暉君也在微博上發(fā)了招聘貼,表示人工智能正在迎來(lái)新一輪產(chǎn)業(yè)劇變,往AGI圣杯的方向加速邁進(jìn),LLM+Robotics的組合已是必然趨勢(shì),機(jī)器人將在不久的未來(lái)迎來(lái)應(yīng)用場(chǎng)景爆發(fā)的拐點(diǎn),希望更多人加入他們這個(gè)年輕的團(tuán)隊(duì),一起擁抱AI世界的星辰大海。
具身人形機(jī)器人才是未來(lái)?
就今天發(fā)布的新品來(lái)看,稚暉君選擇的方向是具身人形機(jī)器人。
所謂具身智能,就是Embodied Intelligence,簡(jiǎn)稱EI,圖靈于1950年在論文《Computing Machinery and Intelligence》中第一次提出這一概念。具身智能可以讓機(jī)器像人一樣能和環(huán)境交互感知,自主規(guī)劃、決策、行動(dòng),并具備執(zhí)行能力,也被認(rèn)為是AI的終極形態(tài)。
知名美籍華裔人工智能學(xué)者李飛飛曾經(jīng)直言,具身智能將會(huì)成為AI領(lǐng)域的下一個(gè)“北極星問(wèn)題”之一。而英偉達(dá)首席執(zhí)行官黃仁勛也表達(dá)過(guò)類似的觀點(diǎn),稱“AI的下一個(gè)浪潮將是具身智能”。
就在今年7月,李飛飛帶隊(duì)的項(xiàng)目組,發(fā)布了一項(xiàng)最新的“具身智能”成果——VoxPoser。
其原理就是使用者給定執(zhí)行具體需求的自然語(yǔ)言指令,以及環(huán)境信息(通過(guò)相機(jī)采集的RGB-D的圖像),然后,LLM(Large Language Model,大語(yǔ)言模型)將根據(jù)以上信息生成與VLM(Visual Language Model,視覺(jué)-語(yǔ)言模型)交互的代碼。
基于這一系列操作,系統(tǒng)會(huì)自動(dòng)生成相應(yīng)的供機(jī)器人進(jìn)行空間感知的“3D Value Map”(3D值圖)。它會(huì)“告訴”機(jī)器人自己在哪里、目標(biāo)在哪里。
這一成果的最大亮點(diǎn)在于——整個(gè)機(jī)器人訓(xùn)練過(guò)程是不需要進(jìn)行任何額外的數(shù)據(jù)投喂和預(yù)訓(xùn)練的。換而言之,目前機(jī)器人訓(xùn)練所需要進(jìn)行的預(yù)定義訓(xùn)練、大規(guī)模數(shù)據(jù)缺失等問(wèn)題,在這里統(tǒng)統(tǒng)不存在。
正是因?yàn)榫邆渖鲜瞿芰?,機(jī)器人只要符合相關(guān)流程,也基本能夠完成任何給定任務(wù)。
關(guān)于VoxPoser這項(xiàng)成果,可以說(shuō)又是人工智能領(lǐng)域和機(jī)器人領(lǐng)域融合的一個(gè)新的里程碑!
而在機(jī)器人形態(tài)方面,智元團(tuán)隊(duì)也認(rèn)可人形機(jī)器人才是終極目標(biāo)。
我們熟悉的馬斯克就是人形機(jī)器人的忠實(shí)擁躉。
在前不久的二季度業(yè)績(jī)說(shuō)明會(huì)上,特斯拉CEO埃隆·馬斯克公布了備受關(guān)注的特斯拉人形機(jī)器人Optimus的最新進(jìn)展。馬斯克表示,特斯拉已經(jīng)生產(chǎn)了10臺(tái)人形機(jī)器人。預(yù)計(jì)在今年11月份進(jìn)行行走測(cè)試,計(jì)劃明年在特斯拉工廠進(jìn)行實(shí)用性測(cè)試。
除了特斯拉,小米也研發(fā)了其首個(gè)全尺寸人形仿生機(jī)器人“CyberOne”,中文名“鐵大”。整機(jī)高為1.77米,重量為52KG,跟正常的成人一般大小。
據(jù)雷軍介紹,“鐵大”擁有和人類一樣的高智商,它能感知45種人類語(yǔ)義情緒,分辨85種環(huán)境語(yǔ)義?!拌F大”采用了小米全自研全身控制算法,協(xié)調(diào)運(yùn)動(dòng)21個(gè)關(guān)節(jié)自由度,全身5種關(guān)節(jié)驅(qū)動(dòng),峰值扭矩可達(dá)300Nm;在視覺(jué)方面,通過(guò)Mi Sense視覺(jué)空間系統(tǒng)加持,“鐵大”具備三維重建真實(shí)世界的能力。
不久前的WRC 2023上,知名機(jī)器人公司優(yōu)必選則對(duì)外發(fā)布了人形機(jī)器人智能多模態(tài)交互系統(tǒng),這是一個(gè)集人機(jī)交互、指令理解、自主規(guī)劃、任務(wù)執(zhí)行等技術(shù)于一體的智能系統(tǒng)。
優(yōu)必選科技在展臺(tái)上還展示了熊貓機(jī)器人優(yōu)悠和Walker X,它們都是剛從成都大運(yùn)會(huì)閉幕式趕赴北京的騎過(guò)平衡車的大型人形機(jī)器人。
總體來(lái)看,人形機(jī)器人已經(jīng)站上了風(fēng)口。未來(lái),具身智能+人形將成為一個(gè)大殺器。
寫在最后
發(fā)布會(huì)的最后,稚暉君通過(guò)一段視頻展示了智元這個(gè)富有活力的團(tuán)隊(duì)~
創(chuàng)業(yè)維艱,但是熱愛(ài)的熱情似乎可以克服一切阻力。
在談到自己的夢(mèng)想時(shí),稚暉君說(shuō)道:
“我的夢(mèng)想之一,就是希望有一天能夠讓科幻電影里的智能機(jī)器人真正變?yōu)楝F(xiàn)實(shí),這些機(jī)器人不再是簡(jiǎn)單的機(jī)械裝置,而是擁有自主思考能力和學(xué)習(xí)能力的伙伴,能夠感知和理解我們的世界,然后與我們進(jìn)行深入的溝通和合作。”
致敬每一個(gè)追夢(mèng)人!
也期待未來(lái)遠(yuǎn)征AI的更多驚喜~
-
機(jī)器人
+關(guān)注
關(guān)注
210文章
28103瀏覽量
205852 -
AI
+關(guān)注
關(guān)注
87文章
29806瀏覽量
268106 -
智能機(jī)器人
+關(guān)注
關(guān)注
17文章
862瀏覽量
82166 -
稚暉君
+關(guān)注
關(guān)注
5文章
35瀏覽量
5123
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論