中國自動化學會專家谘詢工作委員會指定宣傳媒體
新聞詳情

穀歌開發“機器人憲法”防止傷害人類,靈感來自機器人三定律

http://www.kadhoai.com.cn 2026-04-07 01:19:52 來源:澎湃新聞

穀歌為人工智能機器人開發了一部“機器人憲法”,讓機器人不傷害人類。

當地時間1月4日,穀歌DeepMind機器人團隊公布了三項新進展,稱這些進展將幫助機器人在自然環境中做出更快、更好、更安全的決策。其中一項進展是一個收集訓練數據的“機器人憲法”係統——AutoRT。

穀歌的數據收集係統AutoRT利(li)用(yong)了(le)基(ji)礎(chu)大(da)模(mo)型(xing)的(de)潛(qian)力(li),有(you)助(zhu)於(yu)開(kai)發(fa)能(neng)夠(gou)理(li)解(jie)人(ren)類(lei)實(shi)際(ji)目(mu)標(biao)的(de)機(ji)器(qi)人(ren)。它(ta)通(tong)過(guo)收(shou)集(ji)數(shu)據(ju)幫(bang)助(zhu)擴(kuo)展(zhan)機(ji)器(qi)人(ren)學(xue)習(xi),從(cong)而(er)更(geng)好(hao)地(di)訓(xun)練(lian)機(ji)器(qi)人(ren)適(shi)應(ying)現(xian)實(shi)世(shi)界(jie)。

AutoRT結合了視覺語言模型(VLM)、大語言模型(LLM)以及機器人控製模型(RT-1或RT-2),讓機器人在新環境中收集訓練數據。AutoRT可一次性安全指揮20個機器人,機器人隻配備一個攝像頭、jixiebiheyidongjizuo,meigejiqirenliyongshijiaoyuyanmoxinglailejieqizhouweihuanjingheshixianneidewuti,dayuyanmoxingzehuitichuyixiliejiqirenkeyizhixingdechuangzaoxingrenwu,birubalingshifangzaitaimianshang,huozhebanyanjuecezheweijiqirenxuanzeheshiderenwu。

盡管AutoRT是一個數據收集係統,但它具有安全護欄,其中之一就是提供“機器人憲法”。穀歌的“機器人憲法”采用“以安全為重點的提示”,指示大語言模型避免選擇涉及人類、動物、尖銳物體甚至電器的任務。這部“機器人憲法”的靈感來自科幻作家艾薩克·阿西莫夫(Isaac Asimov)的“機器人三定律”,即機器人不得傷害人,也不得見人受傷害而袖手旁觀;機器人應服從人的一切命令,但不得違反第一定律;機器人應保護自身安全,但不得違反第一、第二定律。為了提高安全性,DeepMind對機器人進行編程,如果機器人關節受力超過一定閾值就會自動停止,並安裝了一個物理終止開關,讓人類操控機器人停止工作。

在七個月時間裏,穀歌在不同辦公大樓中共部署52個獨特的機器人,收集了包括6650個獨特任務的77000次機器人試驗的不同數據集。據The Verge報道,一些機器人由人類操作員遠程控製,而其他機器人則根據腳本或完全自主使用穀歌的機器人Transformer(Robotic Transformer)人工智能學習模型進行操作。

DeepMind的其他新技術還包括神經網絡架構SARA-RT,旨在讓現有的機器人Transformer人工智能學習模型更快更準確。此外還宣布了RT-Trajectory模型,幫助機器人更好地完成擦桌子等特定物理任務。

對(dui)人(ren)類(lei)來(lai)說(shuo),理(li)解(jie)如(ru)何(he)擦(ca)桌(zhuo)子(zi)是(shi)一(yi)種(zhong)直(zhi)覺(jiao),但(dan)機(ji)器(qi)人(ren)可(ke)以(yi)通(tong)過(guo)多(duo)種(zhong)方(fang)式(shi)將(jiang)指(zhi)令(ling)轉(zhuan)化(hua)為(wei)實(shi)際(ji)的(de)物(wu)理(li)動(dong)作(zuo)。傳(chuan)統(tong)上(shang),訓(xun)練(lian)機(ji)械(xie)臂(bi)依(yi)賴(lai)於(yu)將(jiang)抽(chou)象(xiang)的(de)自(zi)然(ran)語(yu)言(yan)(如擦桌子)映射到特定動作,例如閉合抓手、向左移動、向右移動,但這使得模型很難推廣到新的任務中。

而RT-Trajectory模型可以在訓練視頻中自動添加描述機器人運動的視覺輪廓。RT-Trajectory在訓練數據集中采集每個視頻,並將其與機器人手臂抓手執行任務時的2D軌跡草圖疊加。這些軌跡為模型學習機器人控製策略提供了低級實用的視覺提示。

DeepMind表示,相比之下,RT-Trajectory模型能夠通過解釋視頻或草圖中包含的特定機器人動作讓機器人理解“如何做”任務。該係統用途廣泛,它還可以通過觀看人類演示任務來創建軌跡,甚至可以接受手繪草圖,它也可以輕鬆適應不同機器人平台。

版權所有 工控網 Copyright©2026 Gkong.com, All Rights Reserved