http://www.kadhoai.com.cn 2026-04-07 01:16:00 來源:金十數據
與OpenAI決裂不久後,Figure AI正式發布Helix,號稱能讓機器人像人類一樣理解世界、執行任務,而無需專門訓練。
Figure AI於周四終於揭曉了促使其與投資方之一OpenAI斷絕關係的“重大突破”:Helix,一種全新的雙係統AI架構,使機器人能夠理解自然語言指令,並操控從未見過的物體,而無需針對每個物體進行特定的預訓練或編程。
Figure AI是一家專注於構建AI賦能仿人機器人的美國初創公司,不久前剛宣布與OpenAI徹底分道揚鑣,首席執行官Brett Adcock解釋稱,Helix在機器人智能方麵的突破讓這家公司不再需要與OpenAI合作。這一決定距兩家公司去年宣布合作僅幾個月,當時Figure AI還完成了一輪6.75億美元融資,估值達到26億美元,以推動其Figure 02機器人開發。
這家人形機器人公司今年早些時候獲得6.75億美元B輪融資,投資者包括OpenAI、微軟、英偉達和傑夫·貝索斯,當時估值達26億美元。據報道,該公司正尋求額外15億美元融資,如果成功,其估值將飆升至395億美元。
這家總部位於加州桑尼維爾(Sunnyvale)的初創公司開發了一種視覺-語言-動作(Vision-Language-Action, VLA)模型,統一了感知、語言理解和學習控製能力,使其能夠進行泛化應用。
與傳統機器人必須針對每項新任務進行大量編程或示範學習不同,Helix模型結合了高級推理係統和實時運動控製係統。這兩個係統有效彌合了語義理解(知道物體是什麼)與運動控製(知道如何操控物體)之間的差距。
Helix的突破在於其雙係統架構,模仿人類認知:一個擁有70億參數的“係統2”視覺-語言模型(VLM),處理高階理解能力,運行頻率7-9Hz(即每秒更新9次),用於結構化和複雜任務的推理,相當於“深思熟慮”;以及一個擁有8000萬參數的“係統1”視覺-運動控製策略(visuomotor policy),運行頻率200Hz(即每秒更新200次),將指令轉化為精確的物理動作,相當於“直覺反應”。
這一突破使機器人能夠隨著時間推移變得更加強大,而無需頻繁更新係統或訓練新數據。為了展示這一技術,Figure AI發布了一段視頻,展示兩台Figure機器人協作整理雜貨,一台機器人遞物品,另一台機器人則將物品放入抽屜和冰箱。
Figure聲稱,這兩台機器人此前並不知道它們正在處理的物品,但仍然能夠識別哪些應該存放在冰箱裏,哪些需要保持幹燥存放。
"Helix可以泛化至任何家居物品," Adcock在社交媒體上表示。"就像人類一樣,Helix能夠理解語音、推理問題,並能抓取任何物體——且無需訓練或額外編程。"
Figure聲稱,這一模型在機器人技術領域創造了多個首次突破。它能以200Hz(每秒200次)的速率持續控製整個仿人機器人上半身,包括手指、手腕、軀幹和頭部方向的動作。它還能讓兩台機器人協作處理從未見過的物體,共同完成任務。
與以往的方法不同,Helixbuyilairenwutedingdeweitiao,ershishiyongtongyizushenjingwangluoquanzhongchulisuoyouxingwei。qizhong,yigexitongjiexiyuyinheshijiaoshuju,shixianfuzajuece,erlingyigexitongzejiangzhilingzhuanhuaweijingzhundeyundongkongzhi,shixianshishixiangying。
"我們已經為此研究了一年多,目標是徹底解決通用機器人問題," Adcock在社交媒體上表示。"僅靠編程無法解決這一問題,我們需要機器人能力實現質的飛躍,才能擴展至10億台機器人級別。"
Helix這一突破開啟了機器人領域的全新“擴展法則”——不再依賴編程,而是通過大規模集體學習,使模型在無需專門訓練的情況下變得更強大。
Figure AI采用500小時的遠程操作機器人行為數據訓練Helix,並利用自動標注流程為每個示範生成自然語言指令。整個係統運行在機器人內部的嵌入式GPU上,使其能夠立即投入商業使用。
Figure AI透露,已與寶馬(BMW)製造部門以及一家未披露的美國主要客戶達成合作。該公司預計,這些合作將為未來四年內部署10萬台機器人奠定基礎。