http://www.kadhoai.com.cn 2026-04-10 14:30:48 來源:澎湃新聞
穀歌為人工智能機器人開發了一部“機器人憲法”,讓機器人不傷害人類。
當地時間1月4日,穀歌DeepMind機器人團隊公布了三項新進展,稱這些進展將幫助機器人在自然環境中做出更快、更好、更安全的決策。其中一項進展是一個收集訓練數據的“機器人憲法”係統——AutoRT。
穀歌的數據收集係統AutoRT利li用yong了le基ji礎chu大da模mo型xing的de潛qian力li,有you助zhu於yu開kai發fa能neng夠gou理li解jie人ren類lei實shi際ji目mu標biao的de機ji器qi人ren。它ta通tong過guo收shou集ji數shu據ju幫bang助zhu擴kuo展zhan機ji器qi人ren學xue習xi,從cong而er更geng好hao地di訓xun練lian機ji器qi人ren適shi應ying現xian實shi世shi界jie。
AutoRT結合了視覺語言模型(VLM)、大語言模型(LLM)以及機器人控製模型(RT-1或RT-2),讓機器人在新環境中收集訓練數據。AutoRT可一次性安全指揮20個機器人,機器人隻配備一個攝像頭、jixiebiheyidongjizuo,meigejiqirenliyongshijiaoyuyanmoxinglailejieqizhouweihuanjingheshixianneidewuti,dayuyanmoxingzehuitichuyixiliejiqirenkeyizhixingdechuangzaoxingrenwu,birubalingshifangzaitaimianshang,huozhebanyanjuecezheweijiqirenxuanzeheshiderenwu。
盡管AutoRT是一個數據收集係統,但它具有安全護欄,其中之一就是提供“機器人憲法”。穀歌的“機器人憲法”采用“以安全為重點的提示”,指示大語言模型避免選擇涉及人類、動物、尖銳物體甚至電器的任務。這部“機器人憲法”的靈感來自科幻作家艾薩克·阿西莫夫(Isaac Asimov)的“機器人三定律”,即機器人不得傷害人,也不得見人受傷害而袖手旁觀;機器人應服從人的一切命令,但不得違反第一定律;機器人應保護自身安全,但不得違反第一、第二定律。為了提高安全性,DeepMind對機器人進行編程,如果機器人關節受力超過一定閾值就會自動停止,並安裝了一個物理終止開關,讓人類操控機器人停止工作。
在七個月時間裏,穀歌在不同辦公大樓中共部署52個獨特的機器人,收集了包括6650個獨特任務的77000次機器人試驗的不同數據集。據The Verge報道,一些機器人由人類操作員遠程控製,而其他機器人則根據腳本或完全自主使用穀歌的機器人Transformer(Robotic Transformer)人工智能學習模型進行操作。
DeepMind的其他新技術還包括神經網絡架構SARA-RT,旨在讓現有的機器人Transformer人工智能學習模型更快更準確。此外還宣布了RT-Trajectory模型,幫助機器人更好地完成擦桌子等特定物理任務。
duirenleilaishuo,lijieruhecazhuozishiyizhongzhijiao,danjiqirenkeyitongguoduozhongfangshijiangzhilingzhuanhuaweishijidewulidongzuo。chuantongshang,xunlianjixiebiyilaiyujiangchouxiangdeziranyuyan(如擦桌子)映射到特定動作,例如閉合抓手、向左移動、向右移動,但這使得模型很難推廣到新的任務中。
而RT-Trajectory模型可以在訓練視頻中自動添加描述機器人運動的視覺輪廓。RT-Trajectory在訓練數據集中采集每個視頻,並將其與機器人手臂抓手執行任務時的2D軌跡草圖疊加。這些軌跡為模型學習機器人控製策略提供了低級實用的視覺提示。
DeepMind表示,相比之下,RT-Trajectory模型能夠通過解釋視頻或草圖中包含的特定機器人動作讓機器人理解“如何做”任務。該係統用途廣泛,它還可以通過觀看人類演示任務來創建軌跡,甚至可以接受手繪草圖,它也可以輕鬆適應不同機器人平台。