中國自動化學會專家谘詢工作委員會指定宣傳媒體
新聞詳情

智元機器人開源全球首個基於全域真實場景百萬數據集

http://www.kadhoai.com.cn 2026-04-07 11:18:46 來源:科創板日報

今日(12月30日),智元機器人聯合上海人工智能實驗室、國家地方共建人形機器人創新中心以及上海庫帕思,正式開源百萬真機數據集AgiBot World,數據質量從實驗室級上升到工業級標準,後續還將發布具身基座大模型。

據智元機器人方麵介紹,AgiBot World是全球首個基於全域真實場景、全能硬件平台、全程質量把控的百萬真機數據集。此前,具身智能訓練領域大規模的開源數據集是Google的Open X-Embodiment。相較於前者,AgiBot World長程數據規模高出10倍,場景範圍覆蓋麵擴大100倍,數據質量也從實驗室級上升到工業級標準。

AgiBot World數據集複刻了家居(40%)、餐飲(20%)、工業(20%)、商超(10%)和辦公(10%)五大核心場景,涵蓋了80餘種日常生活中的動作和技能。

在這個具身數據的世界裏,機器人不再隻是進行簡單的桌麵任務,而是進入到人類日常生活的方方麵麵,既有抓取、放置、推、拉等基礎操作,也有攪拌、折疊、熨燙等複雜動作。

高(gao)質(zhi)量(liang)的(de)數(shu)據(ju)集(ji)對(dui)於(yu)當(dang)下(xia)人(ren)形(xing)機(ji)器(qi)人(ren)技(ji)術(shu)的(de)發(fa)展(zhan)尤(you)為(wei)重(zhong)要(yao)。人(ren)形(xing)機(ji)器(qi)人(ren)需(xu)要(yao)在(zai)訓(xun)練(lian)中(zhong)不(bu)斷(duan)成(cheng)長(chang),才(cai)能(neng)像(xiang)人(ren)一(yi)樣(yang)的(de)活(huo)動(dong)並(bing)完(wan)成(cheng)任(ren)務(wu)。如(ru)同(tong)小(xiao)學(xue)生(sheng)做(zuo)習(xi)題(ti)提(ti)高(gao)自(zi)己(ji)的(de)學(xue)習(xi)能(neng)力(li)一(yi)樣(yang),人(ren)形(xing)機(ji)器(qi)人(ren)也(ye)需(xu)要(yao)數(shu)據(ju)集(ji)這(zhe)樣(yang)的(de)“習題冊”來提升自己。

但是數據,尤其是高質量的的數據仍是發展人形機器人當下一個卡點。現有開源數據集,或多或少都存在采集流程缺乏標準化、機器人構型過時、數據質量格式參差不齊等問題,在機器人策略學習的過程中甚至會帶來副作用。

zaishujucaijifangmian,fuliyezhinengtongyongjiqirenshiyebufuzongcaizhoubinbiaoshi,xianzaidejiqirenshujucaijifangshizhuliudehaishiyirendeyaocaodefangshicaiji,weilaizexuyaogengnirenhua,yitigaoshujuduijushenzhinengdefanhuaheqianyinengli;二是提升數據維度,如增加觸覺等數據輸入,滿足工業和實際場景需求;三是采用虛實結合的技術路徑,提升數據集量級,目前物理世界數據集仍不足。

通(tong)過(guo)低(di)成(cheng)本(ben)方(fang)式(shi),高(gao)質(zhi)量(liang)地(di)獲(huo)取(qu)數(shu)據(ju)對(dui)機(ji)器(qi)人(ren)進(jin)行(xing)訓(xun)練(lian),是(shi)量(liang)產(chan)前(qian)要(yao)解(jie)決(jue)的(de)關(guan)鍵(jian)問(wen)題(ti)。一(yi)直(zhi)以(yi)來(lai),業(ye)界(jie)也(ye)正(zheng)在(zai)積(ji)極(ji)補(bu)齊(qi)短(duan)板(ban),如(ru)特(te)斯(si)拉(la)等(deng)公(gong)司(si)開(kai)展(zhan)大(da)規(gui)模(mo)真(zhen)機(ji)數(shu)據(ju)采(cai)集(ji)。

12月27日,北京國地共建具身智能機器人創新數據采集基地亮相;12月28日,上海提出“搭建超大規模城市級的模擬應用場景,率先賦能具身智能、自動駕駛等大模型實訓”。

國家地方共建人形機器人創新中心(“國地中心”),是目前我國發展人形機器人產業一個重要載體。該中心當前一個重要任務也是組建機器人訓練場收集數據。

國地中心總經理許彬在接受《科創板日報》記者采訪時表示,這個訓練場將落地在浦東張江模力社區,可容納100個人形機器人同時訓練,預計到2027年這一數字將達1000個。

AgiBot World是智元機器人本年度開源的第三個項目,相關數據將在HuggingFace、Github以及agibot-world.com項目主頁上分批上傳。

智元機器人方麵稱,將陸續開源千萬仿真數據,以支持更泛化和更通用的大模型訓練;將發布具身基座大模型,可支持模型微調;發布全套工具鏈,實現采集、訓練和評測閉環。

版權所有 工控網 Copyright©2026 Gkong.com, All Rights Reserved