星動紀元端到端原生機器人大模型ERA-42正式亮相,引領具身大模型進入靈巧操作時代
導語:近期,星動紀元端到端原生機器人大模型ERA-42正式亮相,即“紀元原生機器人大模型”,寓意著不斷探索宇宙萬物的終極答案,展示了其與自研五指靈巧手星動XHAND1結合后的靈巧操作能力,已學會了使用不同工具完成100多種復雜靈巧的操作任務,并且持續(xù)在同一個模型下學習新的技能。例如,拿起桌上螺釘鉆鉆緊螺釘、用錘子敲打釘子、將水杯扶正后再往水杯中倒水等任務。
基于ERA-42,星動XHAND1能用不同工具完成多種靈巧操作新任務
這是業(yè)界首次僅通過同一個具身大模型就實現(xiàn)了五指靈巧手像人手一樣使用多種工具完成上百種靈巧復雜操作任務,展現(xiàn)了ERA-42行業(yè)領先的通用、靈巧操作能力。模型不需要任何預編程技能,完全基于其強大的泛化和自適應力,能在不到2小時內通過收集少量數(shù)據(jù)就學會執(zhí)行新的任務。同時,ERA-42還在快速不斷學習更多新技能中。
基于ERA-42,星動XHAND1可完成100多種精細化、智能化的五指靈巧手操作任務
ERA-42也是世界范圍內首個真正的五指靈巧手具身大模型,開啟了具身大模型的通用靈巧操作時代。
1. “真正”的具身大模型才是開啟通用具身智能體的密鑰,需要具備以下三個要素:
一是統(tǒng)一一個模型泛化多種任務和環(huán)境:通過構建一個統(tǒng)一的原生模型,融合視覺、語言、觸覺和身體姿態(tài)等全模態(tài)信息,實現(xiàn)對不同任務和環(huán)境的泛化能力。
二是端到端:從接收全模態(tài)數(shù)據(jù),到生成最終輸出(如決策、動作等),通過一個簡潔的神經(jīng)網(wǎng)絡鏈路完成。該過程無需人為設計特征、預編程或干預處理步驟,使得具身智能體能夠實時適應不同任務和環(huán)境,顯著提升靈活性與開發(fā)效率。
三是Scaling up(規(guī)模化):真正的統(tǒng)一的端到端算法才允許模型通過持續(xù)的數(shù)據(jù)積累實現(xiàn)自我完善,使得具身大模型在數(shù)據(jù)量指數(shù)級增長的同時,不僅提升性能,還能在未知任務中展現(xiàn)卓越的自適應和泛化能力。
例如,被行業(yè)廣泛熟知的Physical Intelligence (簡稱PI)發(fā)布的π0模型就具備上述要素,是典型的真正意義上的端到端具身大模型。
2. 星動紀元ERA-42是國內首個真正意義上的端到端原生機器人大模型,比肩世界領先水平
早期,星動紀元和PI幾乎同期采用了端到端算法來提升其原生機器人大模型性能,PI推出的π0模型,通過結合互聯(lián)網(wǎng)規(guī)模的視覺-語言預訓練與機器人操作數(shù)據(jù)集后訓練,使得機器人能夠在人類環(huán)境中自主執(zhí)行多種復雜任務,這是機器人從特定任務的“專家”向多任務的“通才”發(fā)展歷程上的重要一步,也是具身大模型領域的一個里程碑。
星動紀元早期發(fā)布的研究成果和Physical Intelligence (PI)幾乎不謀而合
星動論文HiRT: Enhancing Robotic Control with Hierarchical Robot Transformers發(fā)表在CoRL2024
而后,星動紀元又探索了另一條訓練道路,采用大規(guī)模視頻數(shù)據(jù)學習策略,涵蓋無標注的視頻數(shù)據(jù)、公開各類形態(tài)機器人的數(shù)據(jù)、人類活動數(shù)據(jù)以及遙操作數(shù)據(jù)等。并且,在上述數(shù)據(jù)的使用上,星動紀元不是直接模仿視頻里的人怎么去做,而是學習行動之后會產生什么樣的結果。這種方式使得學習效果不受限于數(shù)據(jù)質量,能大大降低數(shù)據(jù)收集成本,解決了數(shù)據(jù)消耗量巨大、需要大量高質量數(shù)據(jù)的行業(yè)難題。
此外,星動紀元的技術團隊已將世界模型融入原生機器人大模型中,使得模型不僅具備行動能力,還具備了對物理世界的理解能力,能夠對未來行動軌跡進行預測。
后期,星動紀元探索了融合世界模型的原生機器人大模型
星動論文Prediction with Action: Visual Policy Learning via Joint Denoising Process發(fā)表在NeurIPS 2024
還能迅速響應外部干擾,并在任務執(zhí)行過程中持續(xù)自適應優(yōu)化行為,直至任務完成。提升了機器人執(zhí)行任務的高效性和準確性。
星動紀元打造的端到端原生機器人大模型ERA-42憑借其預測能力,模型具備強大的泛化、自適應和規(guī)模化能力。結合星動紀元為AI打造的全新硬件平臺,可快速實現(xiàn)具身智能體軟硬件協(xié)同進化和商業(yè)化落地。
3. 星動紀元端到端原生機器人大模型ERA-42引領具身大模型進入通用靈巧操作時代
1)相比夾爪,星動XHAND1已經(jīng)可以完成100多種精細化、智能化的復雜靈巧操作任務
相比夾爪,基于ERA-42能力,五指靈巧手能夠真正像人手一樣使用更多種多樣的工具,完成更通用、靈巧性更強、復雜度更高的百種以上操作任務。
基于ERA-42,五指靈巧手星動XHAND1相比夾爪能使用更多不同工具執(zhí)行更靈巧操作
2)星動紀元原生機器人大模型ERA-42能理解物理世界和預測未來
融合世界模型后,ERA-42具備對物理世界的理解以及對未來的預測的能力,從而大幅提升了泛化能力和任務成功率。
例如,下圖中上方的圖片展示了真實物理世界中打開冰箱的逐幀操作,下方的圖片則為ERA-42生成的環(huán)境建模與對打開冰箱任務的逐幀預測。可以看到兩張圖片非常接近,說明模型預測非常準確。這與其他機器人大模型直接學習行動、而忽視對世界本身理解的方式,或者僅將世界模型用于生成仿真數(shù)據(jù)的方式,存在本質的區(qū)別。
真實世界執(zhí)行任務和ERA-42預測執(zhí)行任務對比圖
3)星動紀元原生機器人大模型ERA-42具備更強泛化能力
基于大規(guī)模視頻數(shù)據(jù)的預訓練,只需采集少部分數(shù)據(jù),基于ERA-42的泛化能力,短時間內通過單一的策略靈巧手就能學會執(zhí)行新的操作任務。此前,星動紀元技術團隊就通過這種訓練方式采集簡單的紅黃藍方塊抓取數(shù)據(jù),成功實現(xiàn)了從未見過的多樣化物體(如胡蘿卜、茄子等)的抓取泛化,并相對其他模型算法在泛化任務上顯著提升了成功率。
通過簡單彩色方塊的抓取數(shù)據(jù)實現(xiàn)多樣化物體的泛化抓取操作
4)星動紀元原生機器人大模型ERA-42具備更強自適應性
由于融合了世界模型,ERA-42不管在單任務上,還是長序列任務上都展現(xiàn)出了業(yè)內領先的強大抗干擾能力。
5)星動紀元原生機器人大模型ERA-42初步體現(xiàn)“Scaling效應”
并且研究結果表明,隨著模型規(guī)模的擴大,任務成功率也明顯提升,初步體現(xiàn)了和大語言模型訓練中類似的“Scaling效應”,即模型規(guī)模與性能之間的正相關性。
“Scaling效應”顯示模型與機器人性能呈現(xiàn)正相關性
4.星動紀元端到端原生機器人大模型ERA-42和為AI打造的全新硬件平臺協(xié)同進化,共建原生具身智能體
構建通用具身智能體需要軟硬件協(xié)同迭代,就像人類的腦和身體是從小到大同步協(xié)同成長的一樣。
構建原生通用具身智能體=原生機器人大模型+為AI定義的硬件平臺協(xié)同進化
因此,星動紀元打造了為AI定義的全新硬件平臺。以星動自研推出的五指靈巧手星動XHAND1為例,共有12個主動自由度,并采用純電驅方式,且每個自由度都有對應的驅動源,實現(xiàn)全自主五指關節(jié)驅動,能執(zhí)行高精度任務。星動XHAND1每個手指配備一個高分辨率(>100點)觸覺陣列傳感器,提供精確的三維力觸覺和溫度信息。單手最大握力能達80N,負載可達25kg。
星動XHAND1 —— 全自驅 真自由
星動XHAND1在作業(yè)能力上展現(xiàn)出的高性能在協(xié)同ERA-42后,為實現(xiàn)復雜靈巧操作任務奠定了基礎。
依托ERA-42,星動紀元通用人形機器人執(zhí)行任務的通用性和泛化性將大幅提升,結合此前發(fā)布的在復雜多樣的地形上穩(wěn)定行走和奔跑的運動性能,配合上下肢協(xié)同作業(yè)能力,潛在應用場景也將更加多元化,真正實現(xiàn)原生的通用具身智能體的產業(yè)化落地。
關鍵詞:
您可能也感興趣:
為您推薦
中國紅APP正式上線發(fā)布
第十二屆東亞地方政府會議將在山東臨沂召開 促進東亞地區(qū)交流合作
(鄉(xiāng)村行·看振興)山西柳林依托“數(shù)商興農”打造鄉(xiāng)村e鎮(zhèn) 電商交易9個月達3.5億元
排行
- 以初心鑄匠心,揚子江藥業(yè)集團榮獲人民網(wǎng)“人民匠心獎”
- 董明珠:格力電器創(chuàng)新力榮登COP28,演講點亮中國制造業(yè)發(fā)展之光
- CBE中國美容博覽會開幕在即,諾斯貝爾攜新品彰顯“戰(zhàn)痘”實力
- 教育賽道未來可期,科大訊飛智慧教育助力孩子個性化發(fā)展
- 陸金所會員2.0襲來:多元化升級用戶權益,為美好生活賦能
- 明星主播唐笑應邀參加首屆中國國際消費品博覽會簽約儀式 助...
- 黃河旋風:超硬材料單晶產品支撐行業(yè)下游產業(yè)發(fā)展
- 重塑IP新場景!鄭州絨言絨語走進鄂爾多斯金鼎亨深度探索
- 在這里,遇見更高能級的“自由貿易”——寫在2024海南國際知...
- 荷蘭佳貝艾特——進口羊奶粉市場的風向標,營養(yǎng)新選擇
最近更新
- 星動紀元端到端原生機器人大模型ERA-42正式亮相,引領具身大...
- 在這里,遇見更高能級的“自由貿易”——寫在2024海南國際知...
- 明朝萬達喜獲“博士后科研工作站”,科研創(chuàng)新再上新臺階
- 西南大G俱樂部沉浸式年會盛典《我們不一樣》盛大開機
- 聚焦文化+情感+場景三力合一,揭秘厚德金差異化策略破“卷”...
- 光明園迪告訴你,護眼臺燈這樣選材正確
- 十七載“冬至滋補節(jié)”,東阿阿膠將品牌營銷推向新高峰
- 車險退保的影響范圍有哪些?
- “溯光”論壇見證衛(wèi)龍創(chuàng)新力量,榮登年度影響力榜單
- 首款產品樂福與重卡概念車重磅亮相 福田卡文汽車續(xù)寫美好
- 豐坦機器人入選“2024值得關注的硬科技創(chuàng)變者50強”
- 聯(lián)動BC端,亮相央視頻《千古名篇》,舍得酒升級福文化IP迎戰(zhàn)...
- 楊德龍:美聯(lián)儲如期降息25個基點 利于我國央行實施適度寬松...
- 老酒戰(zhàn)略引領,四年“再造”一個舍得
- 碧迪醫(yī)療在華第三座世界級生產基地正式啟幕,引領本土創(chuàng)新鏈升級
- 深度數(shù)科企服平臺“票企寶” 票據(jù)融資新引擎,助力小微企業(yè)...
- 深度數(shù)科企服平臺:專業(yè)法律咨詢 護航企業(yè)成長
- 從數(shù)據(jù)到價值:深度數(shù)科推動票據(jù)生態(tài)鏈升級 引領科技時代變革
- 唱響華夏文化傳承之聲,胡姬花古法花生油獻禮澳門回歸25周年
- 回憶革命歷史,傳承紅色基因 | 梨花教育母公司十方融海聯(lián)合...
- 全球聚焦這場盛會 2024國際知識產權交易大會盛大開幕
- A7上場,一路超神!愛瑪旗艦產品A7Plus全新發(fā)布,以科技創(chuàng)新...
- 沁新集團沁能選煤廠喜獲“全國十佳選煤廠”榮譽稱號
- 出海不能只關注“一兩張訂單”,中企跨境找到企業(yè)全球成長的...
- 新東方英語名師胡晨光:提分路上的璀璨星光
- “有一百”黔貨出山專屬平臺
- 華熙生物授權馨辰生物公域渠道獨家使用燕窩酸原料
- 第三屆上合組織國家職工技能大賽在青島開幕
- 巴西福利幼兒園迎來“中國好朋友”
- “青藏門戶”海東市舉行徒步活動:萬人走進自然 享運動之樂
今日要聞
- 在這里,遇見更高能級的“自由貿易”——寫在2024海南國際知識產權交易大會閉幕之際
- 星動紀元端到端原生機器人大模型ERA-42正式亮相,引領具身大模型進入靈巧操作時代
- 明朝萬達喜獲“博士后科研工作站”,科研創(chuàng)新再上新臺階
- 聚焦文化+情感+場景三力合一,揭秘厚德金差異化策略破“卷”突圍之路!
- 西南大G俱樂部沉浸式年會盛典《我們不一樣》盛大開機
- 光明園迪告訴你,護眼臺燈這樣選材正確
- 十七載“冬至滋補節(jié)”,東阿阿膠將品牌營銷推向新高峰
- 車險退保的影響范圍有哪些?
- “溯光”論壇見證衛(wèi)龍創(chuàng)新力量,榮登年度影響力榜單
- 首款產品樂福與重卡概念車重磅亮相 福田卡文汽車續(xù)寫美好