中國自動化學會專家谘詢工作委員會指定宣傳媒體
新聞詳情

智元機器人開源全球首個基於全域真實場景百萬數據集

http://www.kadhoai.com.cn 2026-04-07 01:13:52 來源:科創板日報

今日(12月30日),智元機器人聯合上海人工智能實驗室、國家地方共建人形機器人創新中心以及上海庫帕思,正式開源百萬真機數據集AgiBot World,數據質量從實驗室級上升到工業級標準,後續還將發布具身基座大模型。

據智元機器人方麵介紹,AgiBot World是全球首個基於全域真實場景、全能硬件平台、全程質量把控的百萬真機數據集。此前,具身智能訓練領域大規模的開源數據集是Google的Open X-Embodiment。相較於前者,AgiBot World長程數據規模高出10倍,場景範圍覆蓋麵擴大100倍,數據質量也從實驗室級上升到工業級標準。

AgiBot World數據集複刻了家居(40%)、餐飲(20%)、工業(20%)、商超(10%)和辦公(10%)五大核心場景,涵蓋了80餘種日常生活中的動作和技能。

在這個具身數據的世界裏,機器人不再隻是進行簡單的桌麵任務,而是進入到人類日常生活的方方麵麵,既有抓取、放置、推、拉等基礎操作,也有攪拌、折疊、熨燙等複雜動作。

高gao質zhi量liang的de數shu據ju集ji對dui於yu當dang下xia人ren形xing機ji器qi人ren技ji術shu的de發fa展zhan尤you為wei重zhong要yao。人ren形xing機ji器qi人ren需xu要yao在zai訓xun練lian中zhong不bu斷duan成cheng長chang,才cai能neng像xiang人ren一yi樣yang的de活huo動dong並bing完wan成cheng任ren務wu。如ru同tong小xiao學xue生sheng做zuo習xi題ti提ti高gao自zi己ji的de學xue習xi能neng力li一yi樣yang,人ren形xing機ji器qi人ren也ye需xu要yao數shu據ju集ji這zhe樣yang的de“習題冊”來提升自己。

但是數據,尤其是高質量的的數據仍是發展人形機器人當下一個卡點。現有開源數據集,或多或少都存在采集流程缺乏標準化、機器人構型過時、數據質量格式參差不齊等問題,在機器人策略學習的過程中甚至會帶來副作用。

在(zai)數(shu)據(ju)采(cai)集(ji)方(fang)麵(mian),傅(fu)利(li)葉(ye)智(zhi)能(neng)通(tong)用(yong)機(ji)器(qi)人(ren)事(shi)業(ye)部(bu)副(fu)總(zong)裁(cai)周(zhou)斌(bin)表(biao)示(shi),現(xian)在(zai)的(de)機(ji)器(qi)人(ren)數(shu)據(ju)采(cai)集(ji)方(fang)式(shi)主(zhu)流(liu)的(de)還(hai)是(shi)以(yi)人(ren)的(de)遙(yao)操(cao)的(de)方(fang)式(shi)采(cai)集(ji),未(wei)來(lai)則(ze)需(xu)要(yao)更(geng)擬(ni)人(ren)化(hua),以(yi)提(ti)高(gao)數(shu)據(ju)對(dui)具(ju)身(shen)智(zhi)能(neng)的(de)泛(fan)化(hua)和(he)遷(qian)移(yi)能(neng)力(li);二是提升數據維度,如增加觸覺等數據輸入,滿足工業和實際場景需求;三是采用虛實結合的技術路徑,提升數據集量級,目前物理世界數據集仍不足。

通(tong)過(guo)低(di)成(cheng)本(ben)方(fang)式(shi),高(gao)質(zhi)量(liang)地(di)獲(huo)取(qu)數(shu)據(ju)對(dui)機(ji)器(qi)人(ren)進(jin)行(xing)訓(xun)練(lian),是(shi)量(liang)產(chan)前(qian)要(yao)解(jie)決(jue)的(de)關(guan)鍵(jian)問(wen)題(ti)。一(yi)直(zhi)以(yi)來(lai),業(ye)界(jie)也(ye)正(zheng)在(zai)積(ji)極(ji)補(bu)齊(qi)短(duan)板(ban),如(ru)特(te)斯(si)拉(la)等(deng)公(gong)司(si)開(kai)展(zhan)大(da)規(gui)模(mo)真(zhen)機(ji)數(shu)據(ju)采(cai)集(ji)。

12月27日,北京國地共建具身智能機器人創新數據采集基地亮相;12月28日,上海提出“搭建超大規模城市級的模擬應用場景,率先賦能具身智能、自動駕駛等大模型實訓”。

國家地方共建人形機器人創新中心(“國地中心”),是目前我國發展人形機器人產業一個重要載體。該中心當前一個重要任務也是組建機器人訓練場收集數據。

國地中心總經理許彬在接受《科創板日報》記者采訪時表示,這個訓練場將落地在浦東張江模力社區,可容納100個人形機器人同時訓練,預計到2027年這一數字將達1000個。

AgiBot World是智元機器人本年度開源的第三個項目,相關數據將在HuggingFace、Github以及agibot-world.com項目主頁上分批上傳。

智元機器人方麵稱,將陸續開源千萬仿真數據,以支持更泛化和更通用的大模型訓練;將發布具身基座大模型,可支持模型微調;發布全套工具鏈,實現采集、訓練和評測閉環。

版權所有 工控網 Copyright©2026 Gkong.com, All Rights Reserved