中國工程院院士王耀南專訪：人工智能讓機器視覺正走向智能化 - 工控新聞自動化新聞中華工控網

返回工控網首頁

中國自動化學會專家谘詢工作委員會指定宣傳媒體

免費注冊

中華工控網

廣告服務 | 客服中心

新聞詳情

中國工程院院士王耀南專訪：人工智能讓機器視覺正走向智能化

http://www.kadhoai.com.cn 2026-04-07 01:07:40 來源：南方都市報

“得益於大語言模型推動人工智能發展，圖形圖像學的研究和應用迎來新的機遇，正在推動大語言模型向大視覺模型發展。”2023年12月30日，在辭舊迎新之際，中國工程院院士、機(ji)器(qi)人(ren)視(shi)覺(jiao)感(gan)知(zhi)與(yu)控(kong)製(zhi)技(ji)術(shu)國(guo)家(jia)工(gong)程(cheng)研(yan)究(jiu)中(zhong)心(xin)主(zhu)任(ren)王(wang)耀(yao)南(nan)在(zai)第(di)十(shi)九(jiu)屆(jie)中(zhong)國(guo)圖(tu)象(xiang)圖(tu)形(xing)學(xue)學(xue)會(hui)青(qing)年(nian)科(ke)學(xue)家(jia)會(hui)議(yi)上(shang)，分(fen)享(xiang)機(ji)器(qi)視(shi)覺(jiao)智(zhi)能(neng)化(hua)發(fa)展(zhan)的(de)最(zui)新(xin)趨(qu)勢(shi)。

在zai接jie受shou南nan都dou記ji者zhe專zhuan訪fang時shi，王wang耀yao南nan表biao示shi，人ren工gong智zhi能neng讓rang機ji器qi視shi覺jiao走zou向xiang智zhi能neng化hua，更geng高gao的de算suan力li能neng夠gou支zhi撐cheng大da視shi覺jiao模mo型xing的de訓xun練lian。不bu過guo，更geng聰cong明ming的de大da視shi覺jiao模mo型xing還hai需xu要yao更geng高gao的de算suan力li水shui平ping、更好的模型架構和更有效的學習算法。

本次會議由中國圖象圖形學學會主辦，琶洲實驗室、華南理工大學、中山大學、中國圖象圖形學學會青年工作委員會承辦。

談行業趨勢

從視覺計算走向視覺智能

王耀南：我國的機器視覺研究已有接近40年的曆史，最初是從傳感器的研究開始的，即：將光的信息轉化成圖片信息。接下來要做的是視覺的處理，包括將獲得的圖片增強，使其變得更清晰。

youleqingxidetuxianghou，womenxuyaocongtupianzhonghuoquwomenganxingqudemubiao。liru，zaiwurenjiashilingyu，jiqishijiaoxuyaoduitupianzhongdemubiaojinxingjiance，yaohuidanaxieshiren、哪些是車的問題。

這就是我們所說的機器視覺的三大領域。我把它歸結為：成像、處理和理解。

jiqishijiaoyijingcongguoqudeshijiaojisuanzouxianglejintiandeshijiaozhineng。shijiaojisuanjieherengongzhinenghou，renzhishuipingdedaoletisheng，zengqiangleduifuzahuanjingdelijienengli，zhenggeshijiaozhinenghuaxingyezaiquniandedaolekuaisufazhan。

機器視覺智能化發展的方向是進行廣泛應用，應用到工業檢測、智能製造以及衛星遙感等領域。

談機器視覺，一定要談它的應用，應用驅動技術發展。中國圖象圖形學學會有30個專委會，主要圍繞圖形圖像展開研究，為國民經濟服務。這些技術的應用場景十分廣泛，包括工業、農業、地理信息係統、遙感、國土資源等。

一個人一出生就能看到這個世界，之後理解這個世界，80%的信息靠視覺獲取。機器視覺是要模擬人的眼睛，最終達到人眼的水平，並在部分方麵超過人眼，要看得更遠、看得更清。

談大視覺模型

大視覺模型會越來越聰明

王耀南：大語言模型是用書本上、語言上、文字上的知識作為數據，進行訓練的神經網絡模型，能夠根據它所學的知識進行推理和回答，是一種數據驅動的人工智能。

大視覺模型的數據則主要來自各種圖像，包括人類和自然界產生的視覺數據。例如，醫學大視覺模型就是將人的器官、病變的圖像等作為視覺數據輸入到大模型中，進行訓練得到，可以像大夫一樣看懂CT照片，能夠達到病人來看病後，拍照完便能推理出病人病情的效果。

當前的視覺大模型並沒有大家想象的和人腦一樣，差距還很大。隨著學習的數據的增多、模型參數的調整，模型會越來越大、知識也會越來越多，其智能水平就會越來越高，越來越聰明。

我們需要提高算力水平，加快計算速度，以能夠更快地建立模型；設計更好的模型架構，包括可解釋性更強、更安全可控；還需要研究更有效的學習算法。

事實上，視覺大模型並不是這幾年才有的，是一步一步發展過來的。在上世紀80年(nian)代(dai)，隨(sui)著(zhe)人(ren)工(gong)智(zhi)能(neng)的(de)發(fa)展(zhan)，人(ren)們(men)開(kai)始(shi)研(yan)究(jiu)神(shen)經(jing)網(wang)絡(luo)的(de)時(shi)候(hou)，就(jiu)已(yi)經(jing)有(you)了(le)。隻(zhi)是(shi)，最(zui)近(jin)幾(ji)年(nian)的(de)算(suan)力(li)和(he)算(suan)法(fa)能(neng)力(li)提(ti)高(gao)了(le)，人(ren)們(men)可(ke)以(yi)嚐(chang)試(shi)構(gou)建(jian)大(da)模(mo)型(xing)，產(chan)生(sheng)了(le)大(da)語(yu)言(yan)模(mo)型(xing)和(he)大(da)視(shi)覺(jiao)模(mo)型(xing)。過(guo)去(qu)算(suan)力(li)不(bu)夠(gou)的(de)時(shi)候(hou)，大(da)家(jia)做(zuo)的(de)模(mo)型(xing)沒(mei)有(you)那(na)麼(me)大(da)。

談2024年展望

希望業務從廣州增長推向全國和世界

王耀南：湖南大學機器人視覺感知與控製技術國家工程研究中心在2022年已經入駐到位於粵港澳大灣區的廣州增城，建立了湖大粵港澳大灣區創新研究院（廣州增城）。

研究院主要進行機器智能視覺的研究和應用，包括智能製造、醫yi療liao製zhi藥yao等deng領ling域yu的de特te殊shu作zuo業ye機ji器qi人ren，以yi及ji通tong用yong的de大da視shi覺jiao模mo型xing。例li如ru，這zhe些xie研yan究jiu運yun用yong到dao製zhi造zao業ye中zhong，可ke以yi替ti代dai大da量liang的de人ren工gong，完wan成cheng產chan品pin質zhi量liang的de檢jian測ce，特te別bie是shi3C和高端零部件行業。當前，研究院已經開發了軟硬件係統，主要的功能是賦能廣東企業數字化、智慧化轉型，推動製造業發展。

此外，研究院也開展智能的機器視覺和控製係統，主要用於高端智能裝備的生產，例如工業互聯網軟件，這其中有非常多的算法。

廣東是改革開放和經濟主戰場的前沿，產業鏈、gongyinglianqiquan，zhizaoyeqiyehenduo，womenlaidaoguangdongbujuyishichuyushichangxuqiu。ciwai，womenyanjiuzhongxinciqianyiyoubushaoyanfatuanduizaiguangdongluodilehenduoxiangmu，jinxingkejichengguodezhuanhua。

在2023年的上半年，我們確實遇到了一些挑戰，主要體現在零部件的供應方麵。2024年，我相信這些問題都會解決，廣東人工智能產業的產業鏈、供應鏈以及研發能力都會有所提升。在國內這個大市場裏，會開辟出新的賽道。在活力的氛圍下，大家主動作為、擔當和創新，挑戰都能解決。

我對廣東的人工智能產業發展充滿信心。過去30年裏，我們在科技自立自強方麵下了很多功夫，積累了很多科研成果。廣東是我國經濟第一大省。

我wo們men所suo從cong事shi的de人ren工gong智zhi能neng與yu機ji器qi人ren這zhe個ge領ling域yu趕gan上shang了le一yi個ge好hao機ji遇yu，這zhe兩liang年nian爆bao炸zha性xing地di增zeng長chang，帶dai來lai很hen多duo新xin市shi場chang，拉la動dong了le新xin的de產chan業ye賽sai道dao。未wei來lai智zhi能neng終zhong端duan將jiang越yue來lai越yue多duo，也ye將jiang帶dai動dong生sheng產chan型xing設she施shi設she備bei行xing業ye的de發fa展zhan。在zai2024年，我希望我們位於廣州增城的研究院能夠將業務推向全國和世界。

相關新聞

編輯精選

工控原創

版權所有工控網 Copyright©2026 Gkong.com, All Rights Reserved