http://www.kadhoai.com.cn 2026-04-07 08:57:14 來源:澎湃新聞
7月27日,2025世界人工智能大會(WAIC)進入第二天,最熱鬧、最“核爆”的依然是具身智能。商湯科技、智元機器人當天分別發布“悟能”具身智能平台和麵向真實世界雙臂機器人的世界模型開源平台GE。
“悟能”具身智能平台讓機器人“聞令而動”
在當天召開的“大愛無疆·模塑未來”WAIC 2025大模型論壇上,商湯科技發布“悟能”具身智能平台。該平台以商湯具身世界模型為核心引擎,依托商湯大裝置提供端側和雲側算力支持,能夠為機器人、智能設備提供強大的感知、shijiaodaohangjiduomotaijiaohunengli,tuidongzhinengzhongduanxianggenggaocengcidezizhuhuayuzhinenghuayanjin。gaipingtaikefunengjiqirendenggezhongzhongduanyingjian,shixianduishijiewanwudeganzhilijienengli,bingzhichiqianrudaoduancexinpian,juyouqiangdadechangjingshipeixing。

在7月27日召開的“大愛無疆·模塑未來”WAIC 2025大模型論壇上,商湯科技發布“悟能”具身智能平台。 本文圖均為 受訪者供圖
論壇現場,商湯科技董事長兼首席執行官徐立展示了搭載具身世界引擎的人形機器人講解PPT的效果,機器人語言自然、風趣幽默,不僅可以自動翻頁,還能回答各類問題,並進行階段性小結。
商湯透露,商湯具身世界模型還能構建麵向人、物、場的4D真實世界。用戶僅需要輸入簡單的提示詞,比如“在廚房區域的架子上找東西”“進入娛樂室、向右轉,然後打開通往院子的門”等,具身世界模型就能自主進行位姿、動作骨架和指令的生成,可以說是“聞令而動”。徐立表示,商湯希望“悟能”具身智能平台能夠幫助各種具身智能企業,幫助他們完成和現實世界交互的夢想。
智元發布雙臂機器人世界模型開源平台
同樣是7月27日,由智元機器人主辦、以“全球視角下的具身智能新機遇”為主題的“智啟具身論壇”在上海世博展覽館舉行,彙聚包括來自PI、Intrinsic、清華大學、Sanctuary AI、英偉達、亞馬遜等全球具身智能領域的“最強大腦”,聚焦機器人基礎模型泛化、高性能操控等關鍵方向,開啟了一場跨越學術與產業的“華山論劍”。
智元機器人合夥人&具身業務部總裁姚卯青表示,目前,智元機器人通過自建專業數采工廠,形成了全球最大數據集AgiBot World並開源。智元還發布了行業首個通用具身基座模型——啟元大模型,擁有“一腦多形”能力,可適配其他異構機器人本體。在場景端,智元機器人憑借“機器人+具身模型”技術重構了智能生產力範式,現已在工業製造、倉儲物流、電力巡檢、交互引導四大場景實現突破性落地。
論壇上,姚卯青代表智元機器人發布了行業首個真正麵向真實世界雙臂機器人的世界模型開源平台“Genie Envisioner”(以下簡稱 GE)。該平台融合了預測、控製、評測三大核心能力,為機器人從“看見”到“行動”提供了端到端、一體化的解決方案。

2025世界人工智能大會智元機器人展台。
GE平台的核心是多視角視頻擴散模型GE-Base,以AgiBot-World-Beta數據集為基礎,利用超過100萬條、近3000小時的頭部與雙臂腕同步視頻流,捕捉機器人操作任務中的空間布局、動作演化與語義意圖。160M參數級別的動作解碼器GE-Act,可以幫助機器人完成從視覺感知到動作執行的跨模態遷移。在真實平台驗證中,搭載GE-Act的機器人先後完成“做三明治”“倒茶”“擦桌麵”“使用微波爐加熱”“流水線裝箱”等五項任務,各項成功率均遠超行業平均值。GE平台的發布,標誌著機器人從被動執行向主動“想象—驗證—行動”的轉變,將持續推動智能製造與服務機器人的落地應用。
姚卯青透露,智元的精靈係列下一代機器人本體——精靈G2即將發布。相較於上一代,G2在運動精度、場景適配性上全麵升級,具備原生數采能力,可勝任工業、商業、家庭等多元場景,進一步拓寬具身智能的應用邊界。