中國自動化學會專家谘詢工作委員會指定宣傳媒體
新聞詳情

從Demo到產業化應用:具身智能的“最後一公裏”要走多長時間

http://www.kadhoai.com.cn 2026-04-07 07:30:09 來源:中國信息化周報

當談到具身智能時,大多數不明就裏的人往往會問:具(ju)身(shen)智(zhi)能(neng)是(shi)否(fou)就(jiu)等(deng)於(yu)人(ren)形(xing)機(ji)器(qi)人(ren)?因(yin)為(wei)人(ren)形(xing)機(ji)器(qi)人(ren)被(bei)廣(guang)泛(fan)提(ti)及(ji),熱(re)度(du)也(ye)最(zui)高(gao)。其(qi)實(shi)不(bu)然(ran),從(cong)技(ji)術(shu)的(de)角(jiao)度(du)來(lai)講(jiang),具(ju)身(shen)智(zhi)能(neng)是(shi)指(zhi)通(tong)過(guo)物(wu)理(li)實(shi)體(ti)與(yu)周(zhou)圍(wei)環(huan)境(jing)進(jin)行(xing)互(hu)動(dong),從(cong)而(er)不(bu)斷(duan)增(zeng)長(chang)智(zhi)能(neng)的(de)係(xi)統(tong)。它不僅僅局限於人形機器人,而是指任何能在空間中移動的有形智能機器。

對此,華為雲盤古大模型CTO李寅解釋道,具身智能是一個更寬泛的概念,能夠與不同的硬件本體結合,包括但不限於人形機器人、特種機器人、機械臂、無人機、無人船等。

三種主流技術路線

北京智源人工智能研究院研究員王業全表示,目前,以人形機器人為代表的具身智能包含三個要點:一是智能化;二是運動控製;三(san)是(shi)本(ben)體(ti)。其(qi)中(zhong),對(dui)於(yu)智(zhi)能(neng)化(hua)而(er)言(yan),端(duan)到(dao)端(duan)是(shi)目(mu)前(qian)的(de)主(zhu)流(liu)技(ji)術(shu)路(lu)線(xian)。他(ta)表(biao)示(shi),自(zi)動(dong)駕(jia)駛(shi)領(ling)域(yu),端(duan)到(dao)端(duan)的(de)技(ji)術(shu)路(lu)線(xian)被(bei)視(shi)為(wei)通(tong)向(xiang)高(gao)級(ji)別(bie)自(zi)動(dong)駕(jia)駛(shi)的(de)關(guan)鍵(jian)。此(ci)外(wai),大(da)腦(nao)+小腦也是智能化技術路線中的重要組成部分,其本質是模仿人類,大腦主要負責高級認知功能,包括思維、記憶、情感等,小腦主要負責運動控製方麵的功能。

zaiyundongkongzhijishuluxianzhong,qianghuaxuexifahuilejudazuoyong,nenggoushijiqirentongguoyuhuanjingdejiaohuxuexizuiyoudexingweicelve,dancunzaishujuhuoquchengbenjiaogao,qiejianglixinhaoduiyundongyingxiangdadewenti。“如(ru)果(guo)大(da)家(jia)用(yong)過(guo)市(shi)麵(mian)上(shang)的(de)多(duo)種(zhong)機(ji)器(qi)人(ren),會(hui)發(fa)現(xian)有(you)些(xie)機(ji)器(qi)人(ren)的(de)腳(jiao)步(bu)聲(sheng)音(yin)很(hen)輕(qing),有(you)些(xie)機(ji)器(qi)人(ren)腳(jiao)步(bu)聲(sheng)音(yin)很(hen)重(zhong)。之(zhi)所(suo)以(yi)出(chu)現(xian)這(zhe)種(zhong)現(xian)象(xiang),可(ke)能(neng)是(shi)因(yin)為(wei)訓(xun)練(lian)模(mo)型(xing)相(xiang)關(guan)控(kong)製(zhi)策(ce)略(lve)時(shi),關(guan)注(zhu)更(geng)多(duo)的(de)是(shi)機(ji)器(qi)人(ren)能(neng)否(fou)穩(wen)定(ding)行(xing)走(zou),而(er)不(bu)是(shi)腳(jiao)步(bu)的(de)輕(qing)與(yu)重(zhong)。這(zhe)是(shi)強(qiang)化(hua)學(xue)習(xi)路(lu)線(xian)的(de)特(te)點(dian),更(geng)看(kan)重(zhong)‘獎勵’和‘懲罰’,設置什麼‘獎懲’目標,就會帶來對應的效果。”王業全解釋道。

chucizhiwai,mofangxuexiyeshiyundongkongzhidezhongyaojishuluxian。wangyequanbiaoshi,renleishijubeizhinengde,jushenzhinengrenxingjiqirenjiushiduirenleidemofang,zaizhezhongqingkuangxia,rangjiqirenxiangrenshiyitiaokexingzhilu。zheyisilumeiyouwenti,danshishijianmianlinpoduowenti。

強(qiang)化(hua)學(xue)習(xi)和(he)模(mo)仿(fang)學(xue)習(xi)都(dou)有(you)各(ge)自(zi)的(de)優(you)缺(que)點(dian),那(na)如(ru)果(guo)將(jiang)二(er)者(zhe)結(jie)合(he)起(qi)來(lai),形(xing)成(cheng)強(qiang)強(qiang)聯(lian)合(he)是(shi)不(bu)是(shi)一(yi)種(zhong)更(geng)好(hao)的(de)思(si)路(lu)呢(ne)?對(dui)此(ci),王(wang)業(ye)全(quan)表(biao)示(shi),目(mu)前(qian)科(ke)研(yan)界(jie)正(zheng)在(zai)探(tan)索(suo)將(jiang)強(qiang)化(hua)學(xue)習(xi)和(he)模(mo)仿(fang)學(xue)習(xi)的(de)優(you)點(dian)結(jie)合(he)起(qi)來(lai)。

在本體技術路線中,本體電動驅動是主流方案,其好處是響應速度、kongzhijingduhejingyinxingjiaohao,quedianshichengbenbijiaogao。wangyequanjulishuodao,boshidundonglijiyuyeyaqudongzuoledalianggongzuo,qudelefeichanghaodexiaoguo。yeyaqudongdehaochushishuchugonglvgao、xuhangxingnenghao,bingqienenggoufuzhong,quedianshizaoyinjiaoda,qinglianghuajiaonan。ciwai,wangyequanhaibiaoshi,chudiandongqudongheyeyaqudongfangshizhiwai,haiyouqidongqudonghuoqitadequdongfangshi,muqianhaichuyushiyanshitansuojieduan。

產業應用需循序漸進

wangyequanbiaoshi,congyingyongdejiaodulaishuo,jushenzhinengyoufeichangpangdadechangjinghelingyu,danduinengliyaoqiuhengao。congduanqilaikan,jushenzhinengdebufenzhongdiannenglikenengchanshengyidingdetupobingqiejujiaoyutedingchuileichangjing。changqilaikan,jushenzhinengyidinghuijinrutongyonghuadefazhanjieduan,zheyangcaikenengdadaojiqirenjubeileirenzhinengdechangqimubiao。

李寅表示,2024年,具身智能技術剛開始出現之後,政府的賦能作用可能更為凸顯,就是通過扶持科研機構、高校以及初創企業做一些場景的創新和孵化。2025年到2026年,當具身智能開始更多涉及產業落地時,應該從一些比較成熟的場景中去找到具身智能的落地計劃。2027年之後,具身智能可能會實現從工業到家用的規模複製,此時具身智能才可能真正走進人們的生產和生活。

對(dui)此(ci),中(zhong)興(xing)通(tong)訊(xun)股(gu)份(fen)有(you)限(xian)公(gong)司(si)機(ji)器(qi)人(ren)產(chan)品(pin)總(zong)工(gong)張(zhang)慧(hui)說(shuo)的(de)更(geng)為(wei)具(ju)體(ti)。她(ta)表(biao)示(shi),談(tan)到(dao)具(ju)身(shen)智(zhi)能(neng),更(geng)多(duo)的(de)是(shi)麵(mian)向(xiang)非(fei)結(jie)構(gou)化(hua)和(he)柔(rou)性(xing)化(hua)的(de)場(chang)景(jing)。在(zai)當(dang)前(qian)的(de)技(ji)術(shu)背(bei)景(jing)下(xia),工(gong)業(ye)領(ling)域(yu)可(ke)以(yi)更(geng)快(kuai)地(di)實(shi)現(xian)應(ying)用(yong),因(yin)為(wei)工(gong)業(ye)領(ling)域(yu)不(bu)僅(jin)存(cun)在(zai)很(hen)多(duo)人(ren)為(wei)限(xian)定(ding)的(de)非(fei)結(jie)構(gou)化(hua)場(chang)景(jing),柔(rou)性(xing)化(hua)的(de)場(chang)景(jing)種(zhong)類(lei)也(ye)是(shi)有(you)限(xian)的(de)。在(zai)工(gong)業(ye)領(ling)域(yu)積(ji)累(lei)更(geng)多(duo)能(neng)力(li)之(zhi)後(hou),再(zai)麵(mian)向(xiang)商(shang)業(ye)場(chang)景(jing)、生活場景等泛化性要求更高的場景去做應用。

具體來看,在工業領域中,物料分揀、柔性上下料、倉儲物流因需求迫切、場景可控,可能成為最先落地方向。例如,巨一科技聚焦 SMT 物料分選與大型生產現場物流配送,預計1年內實現應用;中興通訊關注電子元器件分揀與單板插拔,海信則探索展廳講解與大件物料上下料。而在商業服務領域中,導購、清潔、前台接待等場景需求明確,短期內可實現。

從可用到好用的挑戰

2022年之前,具身智能往往麵臨單一的任務、單一的場景和單一的本體,大模型出現之後,具身智能盡管能解決多種任務,跨越不同本體,麵對不同場景,但也存在不好用、不易用、不通用的科學難題,需要研究更加“聰明”的大腦模型和跨本體的大小腦結構框架,來實現跨本體、跨場景、可泛化的具身智能。

李寅表示,當前,具身智能與物理世界的精準交互,對大模型提出了更高要求。像盤古和DeepSeek等(deng)語(yu)言(yan)類(lei)模(mo)型(xing),解(jie)決(jue)的(de)是(shi)從(cong)感(gan)知(zhi)到(dao)認(ren)知(zhi),再(zai)到(dao)決(jue)策(ce)的(de)問(wen)題(ti),並(bing)沒(mei)有(you)解(jie)決(jue)精(jing)神(shen)或(huo)思(si)維(wei)層(ceng)麵(mian)上(shang)的(de)問(wen)題(ti),從(cong)而(er)無(wu)法(fa)實(shi)現(xian)與(yu)物(wu)理(li)世(shi)界(jie)的(de)真(zhen)正(zheng)交(jiao)互(hu)。實(shi)際(ji)上(shang),感(gan)知(zhi)、認知、決策的下一步應該是執行,執行就涉及到與物理世界的交互,隻有具身智能和大模型的結合才有可能解決這一問題。

在具身智能落地應用的過程中,李寅認為存在三大難點:一(yi)是(shi)數(shu)據(ju)嚴(yan)重(zhong)不(bu)足(zu)。她(ta)表(biao)示(shi),工(gong)業(ye)產(chan)線(xian)大(da)多(duo)數(shu)是(shi)半(ban)結(jie)構(gou)化(hua)或(huo)半(ban)標(biao)準(zhun)化(hua)的(de)場(chang)景(jing),盡(jin)管(guan)它(ta)與(yu)泛(fan)化(hua)性(xing)要(yao)求(qiu)更(geng)高(gao)的(de)家(jia)用(yong)場(chang)景(jing)有(you)一(yi)定(ding)區(qu)別(bie),但(dan)即(ji)使(shi)完(wan)成(cheng)在(zai)大(da)家(jia)看(kan)來(lai)很(hen)簡(jian)單(dan)的(de)操(cao)作(zuo),對(dui)具(ju)身(shen)智(zhi)能(neng)來(lai)說(shuo)也(ye)是(shi)非(fei)常(chang)複(fu)雜(za)的(de)長(chang)程(cheng)任(ren)務(wu)。例(li)如(ru),在(zai)手(shou)機(ji)裝(zhuang)配(pei)線(xian)上(shang),將(jiang)手(shou)機(ji)、電源線、手機膜、說明書等統一放在一個包裝盒中,就是目前行業內正在攻關的一個技術難點。目前,解決這些問題所需要的數據依然是稀缺的。

二er是shi模mo型xing。李li寅yin表biao示shi,目mu前qian,具ju身shen智zhi能neng模mo型xing百bai花hua齊qi放fang,到dao底di最zui終zhong的de模mo型xing應ying該gai做zuo成cheng什shen麼me樣yang,才cai能neng讓rang這zhe個ge模mo型xing具ju備bei強qiang大da的de推tui理li能neng力li,能neng夠gou理li解jie真zhen實shi世shi界jie複fu雜za的de環huan境jing並bing且qie準zhun確que的de執zhi行xing任ren務wu,而er且qie還hai具ju備bei一yi定ding的de魯lu棒bang性xing和he泛fan化hua性xing,這zhe也ye是shi具ju身shen智zhi能neng麵mian臨lin的de技ji術shu難nan點dian。

三(san)是(shi)具(ju)身(shen)智(zhi)能(neng)在(zai)產(chan)業(ye)應(ying)用(yong)中(zhong)不(bu)僅(jin)要(yao)麵(mian)對(dui)不(bu)同(tong)的(de)領(ling)域(yu)和(he)場(chang)景(jing),任(ren)務(wu)類(lei)型(xing)也(ye)極(ji)其(qi)碎(sui)片(pian)化(hua)。在(zai)這(zhe)種(zhong)情(qing)況(kuang)下(xia),如(ru)果(guo)要(yao)想(xiang)聯(lian)合(he)打(da)造(zao)具(ju)身(shen)智(zhi)能(neng)係(xi)統(tong),就(jiu)需(xu)要(yao)提(ti)供(gong)完(wan)整(zheng)的(de)工(gong)具(ju)鏈(lian),這(zhe)也(ye)是(shi)亟(ji)待(dai)突(tu)破(po)的(de)一(yi)個(ge)難(nan)點(dian)。

王業全表示,一方麵,目前的大模型還無法滿足具身智能對於視、聽、說、想、做多種模態聯合建模的要求,另一方麵,還不具備自我認知、類人記憶以及人物識別等能力。此外,在相關的技術路線中,無論是VLA路線還是其他路線都存在數據成本極高、泛化性不好的問題。“傳統機器人開發遵循‘控製設計-算法實現-仿真調試’流程,具身智能時代轉向‘數據驅動+ 模型訓練’,需解決異構數據標準化、模型積木式組合等問題。”國家地方共建人形機器人創新中心劉宇飛如是說。

不僅如此,在操作智能方麵,還需攻克成功率、穩定性與魯棒性難題,並且能夠有效應對光照變化、工件差異及環境振動等環境的幹擾。此外,動態平衡與多機器人一致性,情感表達、意圖理解、語音交互的自然性,以及軟硬件的工程化問題也亟待解決。

未wei來lai,全quan模mo態tai大da模mo型xing一yi定ding會hui成cheng為wei具ju身shen智zhi能neng的de核he心xin。在zai具ju身shen智zhi能neng發fa展zhan演yan進jin的de過guo程cheng中zhong,無wu論lun是shi全quan麵mian的de環huan境jing感gan知zhi能neng力li,還hai是shi無wu損sun的de信xin息xi捕bu獲huo能neng力li、類人的思考能力、泛化能力以及一致、準確、合理的行為輸出,對於具身智能來說都是需要具備的。隻有具備這些能力,才能更快地實現從可用到好用的跨越。

版權所有 工控網 Copyright©2026 Gkong.com, All Rights Reserved