http://www.kadhoai.com.cn 2026-04-07 07:30:58 來源:南方財經
6月23日,南方財經記者從帕西尼感知科技(深圳)有限公司(以下簡稱“帕西尼”)處獲悉,該公司主導建設的具身智能超級數據工廠(Super EID Factory)正式投入運營。
作為深圳本土培育的前沿科技企業,本次帕西尼落成的數據工廠選址於天津市河西區空天數字產業園,麵積近12000平方米,預計年產近2億條高維訓練數據。
帕西尼方麵稱,這座超級數據工廠是目前全球範圍規模最大、數據采集體量領先的具身智能數據采集與模型訓練基地,將為當前具身智能產業麵臨的數據集稀缺、觸覺模態數據空白、泛化性差等核心困境提供革命性解決方案。
據悉,這座工廠裏構建了“15+N”個全場景矩陣為基礎的千種任務與百萬道工序,涵蓋汽車製造、3C裝配、家庭、辦公、餐飲、商超、康養、醫療等全鏈條具身智能應用環境,旨在模擬真實世界中機器人可能遇到的各種複雜場景。
zhideyitideshi,zhebingbushidiyigeweihuoqushujuerjianshejushenzhinenggongchangdeanli。ciqianbeijingheshanghaidouyouleisidejushenzhinengjiqirenchuangxinzhongxinfuzeshujushengchanhecaiji。qizhong,beijingjushenzhinengjiqirenchuangxinzhongxinchengliyu2023年,由優必選、京城機電、小米機器人、亦莊機器人等10家行業領軍企事業單位出資聯合組建,號稱數據集將達百萬級。
但dan此ci次ci帕pa西xi尼ni參can與yu建jian設she的de數shu據ju工gong廠chang光guang是shi數shu據ju量liang就jiu奔ben著zhe上shang億yi級ji別bie的de量liang級ji而er去qu。而er這zhe麼me大da量liang的de數shu據ju將jiang涉she及ji的de第di一yi個ge問wen題ti就jiu是shi,數shu據ju能neng否fou通tong用yong。
據了解,為保證數據的廣泛適配性,帕西尼在工廠內部部署150個標準化采集單元,每個標準化數據集采集都基於真人手部動作姿態來捕捉,並通過“空間視覺矩陣”進行“視覺-觸覺”模態對齊,極大地提升了數據的通用性。同時,後續通過體感重定向係統(Soma Redirect),采集而來的數據還能向不同型號、不同設計的機器人輸出,使得數據集有效突破模型的跨本體泛化能力瓶頸。

(圖為工程師佩戴帕西尼自研的“多維觸覺數據采集設備PMEC”在采集數據)
數shu據ju采cai集ji量liang所suo麵mian臨lin的de第di二er個ge問wen題ti就jiu是shi成cheng本ben。帕pa西xi尼ni方fang麵mian表biao示shi,由you於yu無wu需xu依yi賴lai昂ang貴gui的de機ji器qi人ren本ben體ti進jin行xing數shu據ju采cai集ji,帕pa西xi尼ni的de解jie決jue方fang案an顯xian著zhu降jiang低di了le采cai集ji成cheng本ben,使shi得de大da規gui模mo、高質量的數據生產成為可能,為行業發展提供了經濟高效的路徑。
當通用性和成本得到保障之後,第三個需要探討的就是數據集是否足夠高質量。帕西尼方麵稱,其獨創的多模態神經織網技術(Neural Mesh)實現了觸覺、視覺、關節角度、動作軌跡、語音等多維度數據的無損采集。這種多模態數據的融合,能夠為具身智能模型提供更全麵的環境信息,使其能夠更精準地理解任務、感知世界。
該具身智能超級數據工廠不僅能惠及全行業,還能助力帕西尼多模態具身智能數據集(MotionSharing DB),升級成為全模態數據集(OmniSharing DB)。
而升級後的全模態數據集,將進一步提升帕西尼自研的 TacFlow Engine大模型,形成共生飛輪,即數據作為模型的“感官輸入”驅動其進化;模型預測能力的缺口又能反向指導數據的定向增強采集。
值得注意的是,5日前,帕西尼剛完成A係列的第四輪融資,投資方包括TCL創投、毅達資本、尚頎資本、基石資本、商湯國香、中信裏昂、湖南財信產業基金、鈞犀資本等多家知名機構聯合投資,融資金額高達數億元人民幣。