http://www.kadhoai.com.cn 2026-04-10 06:58:09 來源:經濟日報
導讀:目前,機器視覺在工業電子以及半導體行業應用還是最為主要的,如PCB板缺陷檢測、IC芯片缺陷檢測等。交通領域的應用如電子眼也較為廣泛,其他行業如製藥中的藥品成分分析、互聯網中的視覺計算廣告、物流中的物品分揀等等,都有機器視覺應用的影子。機器視覺——這一“第三隻眼”正以巨大的能量,改變著人們的生活和工作方式。
想記錄眼前美景?不用再掏出相機或手機,隻需一句語音指令,佩戴的輕巧時尚的穀歌眼鏡就能立刻拍出眼前的圖景;走在陌生的大街上,不用再查地圖或問路,隻需將手機攝像頭對準街道,諾基亞“城市萬花筒”就能將眼前的商店、餐館和景點直接標注,覆蓋顯示在手機圖像上……這些以往多是在電影中看到的畫麵,已成為普通人可以觸摸到的現實。機器視覺——這一“第三隻眼”正以巨大的能量,改變著人們的生活和工作方式。記者就此專訪中國科學院自動化所專家,為讀者解密神奇的“第三隻眼”
與人眼一決高低
“機器視覺就是用機器代替人眼來進行識別、測量、判斷等。機器視覺係統是通過攝像頭將拍攝對象轉換成圖像信號,然後再交由圖像分析係統進行分析、測量等。”中國科學院自動化研究所模式識別國家重點實驗室研究員黃凱奇博士介紹:“機器視覺是一項典型的跨學科任務,涉及到光學、計算機視覺、模式識別、機器學習、人工智能、統計學、認知心理學等等。”

中國科學院自動化研究所黃凱奇研究員在展示監測機櫃
機(ji)器(qi)視(shi)覺(jiao)最(zui)早(zao)應(ying)用(yong)於(yu)工(gong)業(ye)製(zhi)造(zao)領(ling)域(yu)。通(tong)過(guo)機(ji)器(qi)視(shi)覺(jiao)的(de)自(zi)動(dong)識(shi)別(bie)功(gong)能(neng),許(xu)多(duo)流(liu)水(shui)線(xian)上(shang)具(ju)有(you)高(gao)度(du)重(zhong)複(fu)性(xing)的(de)檢(jian)測(ce)工(gong)作(zuo)都(dou)可(ke)以(yi)不(bu)再(zai)依(yi)靠(kao)人(ren)來(lai)完(wan)成(cheng),大(da)大(da)提(ti)高(gao)了(le)檢(jian)測(ce)效(xiao)率(lv)和(he)精(jing)度(du)。黃(huang)凱(kai)奇(qi)介(jie)紹(shao),機(ji)器(qi)視(shi)覺(jiao)係(xi)統(tong)最(zui)基(ji)本(ben)的(de)特(te)點(dian)就(jiu)是(shi)提(ti)高(gao)生(sheng)產(chan)的(de)靈(ling)活(huo)性(xing)和(he)自(zi)動(dong)化(hua)程(cheng)度(du)。在(zai)一(yi)些(xie)不(bu)適(shi)於(yu)人(ren)工(gong)作(zuo)業(ye)的(de)危(wei)險(xian)工(gong)作(zuo)環(huan)境(jing)或(huo)者(zhe)人(ren)工(gong)視(shi)覺(jiao)難(nan)以(yi)滿(man)足(zu)要(yao)求(qiu)的(de)場(chang)合(he),常(chang)用(yong)機(ji)器(qi)視(shi)覺(jiao)來(lai)替(ti)代(dai)人(ren)工(gong)視(shi)覺(jiao)。同(tong)時(shi),在(zai)大(da)批(pi)量(liang)重(zhong)複(fu)性(xing)工(gong)業(ye)生(sheng)產(chan)過(guo)程(cheng)中(zhong),用(yong)機(ji)器(qi)視(shi)覺(jiao)檢(jian)測(ce)方(fang)法(fa)可(ke)以(yi)大(da)大(da)提(ti)高(gao)生(sheng)產(chan)的(de)效(xiao)率(lv)和(he)自(zi)動(dong)化(hua)程(cheng)度(du)。
一個典型的機器視覺係統包括照明、鏡頭、相機、圖像采集卡和視覺處理器5個ge部bu分fen。由you於yu采cai集ji卡ka能neng更geng加jia迅xun速su地di傳chuan輸shu圖tu像xiang到dao存cun儲chu器qi,且qie計ji算suan機ji速su度du不bu斷duan加jia快kuai,所suo以yi在zai目mu前qian的de機ji器qi視shi覺jiao係xi統tong中zhong,視shi覺jiao處chu理li器qi的de應ying用yong逐zhu漸jian減jian少shao。圖tu像xiang采cai集ji卡ka在zai機ji器qi視shi覺jiao係xi統tong中zhong舉ju足zu輕qing重zhong。比bi較jiao典dian型xing的dePCI或AGPjianrongdebuhuoka,keyijiangtuxiangxunsudichuansongdaojisuanjicunchuqijinxingchuli。youxiecaijikayouneizhideduolukaiguan,kelianjieduotaixiangji,nengkongzhicaijikacaiyongrenyiyigexiangjibuhuodexinxi。
伴隨著技術的發展,機器視覺的功能也在不斷擴展。黃凱奇說:“缺陷檢測是通過機器視覺手段來分析零部件信息,從而判斷其是否存在缺陷;測量是通過使用機器視覺來對考察對象的尺寸、形狀等信息進行度量;人機交互是利用機器視覺工具分析人或者其他機器發出的指令,從而實現對機器的操縱;環境建模是對機器周圍環境進行感知建模,比如移動機器人對路麵環境進行感知建模等。”
“目前總的看來,機器視覺在工業電子以及半導體行業應用還是最為主要的,如PCB板缺陷檢測、IC芯片缺陷檢測等。交通領域的應用如電子眼也較為廣泛,其他行業如製藥中的藥品成分分析、互聯網中的視覺計算廣告、物流中的物品分揀等等,都有機器視覺應用的影子。”黃凱奇說。
機器視覺——這“第三隻眼”已在多個領域展現出了比人眼更強大的功能。黃凱奇表示:“機(ji)器(qi)視(shi)覺(jiao)利(li)用(yong)好(hao)了(le)完(wan)全(quan)可(ke)以(yi)比(bi)人(ren)做(zuo)得(de)更(geng)好(hao),因(yin)為(wei)不(bu)同(tong)的(de)人(ren)在(zai)觀(guan)看(kan)時(shi),信(xin)息(xi)得(de)不(bu)到(dao)充(chong)分(fen)和(he)及(ji)時(shi)的(de)交(jiao)流(liu),主(zhu)觀(guan)性(xing)也(ye)很(hen)強(qiang)。而(er)機(ji)器(qi)視(shi)覺(jiao)不(bu)僅(jin)計(ji)算(suan)功(gong)能(neng)強(qiang)大(da),而(er)且(qie)獲(huo)取(qu)的(de)信(xin)息(xi)通(tong)過(guo)協(xie)同(tong)分(fen)析(xi)後(hou)得(de)到(dao)的(de)知(zhi)識(shi)會(hui)具(ju)有(you)‘極高’的價值,尤其在其更趨於智能化之後。”

中國科學院自動化研究所高偉副研究員在展示利用機器視覺技術生成的三維重建照片。
捕獲“深度”世界
在現實生活中,我們越來越需要更多的三維模型來實現對物體或環境的全麵掌握。“獲huo得de三san維wei模mo型xing有you兩liang種zhong基ji本ben方fang式shi,一yi種zhong是shi利li用yong激ji光guang掃sao描miao儀yi,一yi種zhong是shi拍pai攝she照zhao片pian。但dan激ji光guang掃sao描miao儀yi的de成cheng本ben高gao,也ye有you可ke能neng會hui對dui樣yang本ben帶dai來lai一yi些xie損sun害hai。第di二er種zhong方fang式shi的de成cheng本ben小xiao,而er且qie在zai精jing度du上shang也ye跟gen激ji光guang掃sao描miao儀yi相xiang差cha無wu幾ji,因yin此ci成cheng為wei了le現xian在zai研yan究jiu的de一yi個ge熱re點dian。”中國科學院自動化研究所模式識別國家重點實驗室副研究員高偉博士一邊展示他們的三維重建照片,一邊介紹。
高偉說,一般的圖像上是沒有長度、距離等深度信息的,而三維模型則能更加全麵、精確地記錄環境,可以直觀呈現物體的位置、距離、姿zi態tai等deng。高gao偉wei所suo在zai的de機ji器qi人ren視shi覺jiao團tuan隊dui研yan究jiu開kai發fa的de中zhong國guo古gu代dai建jian築zhu全quan自zi動dong三san維wei重zhong建jian係xi統tong,能neng夠gou實shi現xian全quan自zi動dong三san維wei建jian模mo,即ji從cong底di層ceng圖tu像xiang處chu理li到dao生sheng成cheng最zui終zhong的de三san維wei模mo型xing,全quan部bu自zi動dong實shi現xian,無wu需xu人ren工gong交jiao互hu。它ta對dui圖tu像xiang的de拍pai攝she方fang式shi也ye無wu特te殊shu約yue束shu和he限xian製zhi,隻zhi需xu手shou持chi自zi由you拍pai攝she即ji可ke。在zai精jing度du上shang,也ye與yu激ji光guang掃sao描miao精jing度du相xiang當dang,精jing度du小xiao於yu3cm/100米,通過配備更高像素數量的相機和長焦鏡頭還可以實現毫米級重建。
此ci外wai,在zai實shi時shi定ding位wei與yu在zai線xian三san維wei重zhong建jian方fang麵mian,機ji器qi視shi覺jiao也ye具ju有you極ji大da的de應ying用yong潛qian力li。高gao偉wei介jie紹shao了le通tong過guo機ji器qi視shi覺jiao在zai手shou機ji上shang增zeng強qiang現xian實shi的de原yuan理li,即ji將jiang手shou機ji上shang攝she像xiang頭tou讀du取qu的de視shi頻pin作zuo為wei輸shu入ru,通tong過guo初chu始shi化hua、特征點提取、動態模板特征點匹配、幾何變化計算階段後得到視頻每一幀中感興趣區域的位置。諾基亞手機的“城市萬花筒”就是一個應用實例。
高偉所在團隊在視覺信息處理上的突出創新能力,不斷吸引著國際大企業前來合作。“我(wo)們(men)現(xian)在(zai)就(jiu)正(zheng)與(yu)諾(nuo)基(ji)亞(ya)公(gong)司(si)進(jin)行(xing)合(he)作(zuo),共(gong)同(tong)研(yan)究(jiu)實(shi)時(shi)定(ding)位(wei)和(he)在(zai)線(xian)三(san)維(wei)重(zhong)建(jian)。目(mu)前(qian),我(wo)國(guo)基(ji)於(yu)機(ji)器(qi)視(shi)覺(jiao)的(de)三(san)維(wei)重(zhong)建(jian)技(ji)術(shu)在(zai)國(guo)際(ji)上(shang)可(ke)以(yi)說(shuo)處(chu)於(yu)領(ling)先(xian)地(di)位(wei),應(ying)用(yong)也(ye)是(shi)比(bi)較(jiao)廣(guang)泛(fan)的(de)。”高偉說:“除(chu)了(le)以(yi)上(shang)介(jie)紹(shao)的(de),還(hai)能(neng)用(yong)在(zai)一(yi)些(xie)不(bu)太(tai)適(shi)合(he)人(ren)工(gong)作(zuo)業(ye)的(de)環(huan)境(jing)監(jian)測(ce)方(fang)麵(mian),像(xiang)對(dui)露(lu)天(tian)煤(mei)礦(kuang)的(de)監(jian)測(ce),就(jiu)是(shi)通(tong)過(guo)無(wu)人(ren)機(ji)對(dui)煤(mei)礦(kuang)進(jin)行(xing)全(quan)方(fang)位(wei)拍(pai)攝(she),生(sheng)成(cheng)三(san)維(wei)模(mo)型(xing)來(lai)實(shi)時(shi)監(jian)測(ce)礦(kuang)山(shan)的(de)變(bian)化(hua)。此(ci)外(wai),也(ye)能(neng)應(ying)用(yong)於(yu)城(cheng)市(shi)規(gui)劃(hua)、數字媒體、三維試衣、牙模製造等多方麵。”
由於單純依靠圖像信息很難實現快速、choumidesanweizhongjian,gaoweisuozaituanduiyezaishenruyanjiujiangduozhongchuanganqixinxixianghuronghejinxingsanweizhongjiandefangfa。muqian,tamenyikaifachuleliyongdanmushijiaotongbudingweiyudituchuangjianjishuyijiweiruangongsideKinect設備(微軟公司開發的應用於Xbox360主機的周邊外設,集成一個彩色攝影機、一個紅外攝像機和一個紅外投影機)的全自動場景快速重建係統。這一係統對單幀視頻圖像的處理時間小於50毫秒,可重建出稠密的三維點雲,能廣泛應用於多種室內場景,使用者可以隨意自由拍攝。
互動“大數據”時代
在備受關注的美國政府公布的“大數據研發計劃” (Big Data Research and Development Initiative)中包含一個旨在為機器建立視覺智能的Mind's Eye 項目。該計劃稱,傳統的機器視覺研究的對象選取廣泛的物體來描述一個場景的屬性名詞,而Mind's Eye旨在增加在這些場景的動作認識和推理需要的知覺認知基礎。總之,這些技術可以建立一個更完整的視覺智能效果。
由此可見,走在信息科技前沿的美國已對機器視覺與大數據時代的互動關係先知先覺。黃凱奇指出:“大數據時代最樸素也是最深刻的特點就是‘大’。統(tong)計(ji)學(xue)中(zhong)的(de)大(da)數(shu)定(ding)律(lv)指(zhi)出(chu),當(dang)隨(sui)機(ji)事(shi)件(jian)或(huo)者(zhe)試(shi)驗(yan)在(zai)大(da)量(liang)重(zhong)複(fu)出(chu)現(xian)的(de)條(tiao)件(jian)下(xia),往(wang)往(wang)呈(cheng)現(xian)幾(ji)乎(hu)必(bi)然(ran)的(de)統(tong)計(ji)特(te)性(xing)。確(que)切(qie)地(di)說(shuo),大(da)數(shu)定(ding)律(lv)是(shi)以(yi)確(que)切(qie)的(de)數(shu)學(xue)形(xing)式(shi)表(biao)達(da)了(le)大(da)量(liang)重(zhong)複(fu)出(chu)現(xian)的(de)隨(sui)機(ji)現(xian)象(xiang)的(de)統(tong)計(ji)規(gui)律(lv)性(xing)。對(dui)於(yu)依(yi)賴(lai)數(shu)據(ju)規(gui)律(lv)的(de)機(ji)器(qi)視(shi)覺(jiao)算(suan)法(fa)來(lai)講(jiang),大(da)數(shu)據(ju)無(wu)疑(yi)為(wei)人(ren)們(men)進(jin)一(yi)步(bu)發(fa)現(xian)人(ren)類(lei)的(de)認(ren)知(zhi)機(ji)理(li),實(shi)現(xian)更(geng)加(jia)魯(lu)棒(bang)[魯棒是Robust的音譯,也就是健壯、強壯、堅定、粗野的意思。魯棒性(robustness)就是係統的健壯性]的機器視覺算法提供了可能。另一方麵,隨著機器視覺係統更加魯棒穩定,更加智能,它在收集、分析、處chu理li海hai量liang信xin息xi方fang麵mian也ye將jiang發fa揮hui更geng加jia重zhong要yao的de作zuo用yong。簡jian言yan之zhi,機ji器qi視shi覺jiao一yi邊bian借jie大da數shu據ju之zhi利li不bu斷duan發fa展zhan,一yi邊bian又you靠kao技ji術shu的de完wan善shan而er反fan哺bu大da數shu據ju時shi代dai,形xing成cheng一yi個ge良liang性xing的de互hu動dong。”
然而,這種互動要想真正建立,還需要加強技術和產業的雙輪驅動。“國外在上世紀80年代就已出現大量的機器視覺產品,而我國機器視覺技術的應用始於90年代末。雖然在過去10nianyoulechangzudefazhan,danmuqianjuedabufenhaichuyuzhuiganzhuangtai,yigeshijishushangdejileiyuchuangxingenguowaixiangbihaicunzaijiaodachaju。lingwaiyigeshiguoneizaiyingyongchuangxinshangyecunzaibuzu,henduodoushigensuiguowaideyingyonganlihuozhetongguodailixiangguanchanpinlaishixianmofangyingyongdeng。”黃凱奇表示。
目(mu)前(qian),機(ji)器(qi)視(shi)覺(jiao)在(zai)交(jiao)通(tong)等(deng)多(duo)個(ge)領(ling)域(yu)的(de)應(ying)用(yong)仍(reng)相(xiang)對(dui)單(dan)一(yi),存(cun)在(zai)著(zhe)多(duo)層(ceng)麵(mian)阻(zu)礙(ai)其(qi)進(jin)一(yi)步(bu)產(chan)業(ye)化(hua)發(fa)展(zhan)的(de)因(yin)素(su)。黃(huang)凱(kai)奇(qi)分(fen)析(xi)說(shuo),首(shou)先(xian)在(zai)魯(lu)棒(bang)穩(wen)定(ding)的(de)機(ji)器(qi)視(shi)覺(jiao)係(xi)統(tong)方(fang)麵(mian),因(yin)為(wei)機(ji)器(qi)視(shi)覺(jiao)技(ji)術(shu)涉(she)及(ji)眾(zhong)多(duo)學(xue)科(ke),需(xu)要(yao)不(bu)同(tong)學(xue)科(ke)協(xie)同(tong)創(chuang)新(xin)才(cai)能(neng)突(tu)破(po)目(mu)前(qian)發(fa)展(zhan)的(de)技(ji)術(shu)瓶(ping)頸(jing)。再(zai)一(yi)個(ge)就(jiu)是(shi)標(biao)準(zhun)方(fang)麵(mian),目(mu)前(qian)大(da)部(bu)分(fen)廠(chang)家(jia)為(wei)了(le)自(zi)身(shen)的(de)短(duan)期(qi)局(ju)部(bu)利(li)益(yi)都(dou)各(ge)自(zi)開(kai)發(fa)封(feng)閉(bi)的(de)設(she)備(bei)、協議、係統,這對整個行業的發展極為不利。“如何破除這種封閉狀態的弊端,製定行業統一開放標準是促進機器視覺行業形成大格局、大產業的必經之路。”黃凱奇說。
“還hai有you一yi點dian原yuan因yin,就jiu是shi關guan於yu機ji器qi視shi覺jiao剛gang需xu的de創chuang造zao。我wo國guo是shi一yi個ge典dian型xing的de勞lao動dong力li密mi集ji國guo家jia,大da部bu分fen行xing業ye依yi靠kao的de是shi低di廉lian的de大da量liang富fu餘yu勞lao動dong力li。而er機ji器qi視shi覺jiao與yu自zi動dong化hua息xi息xi相xiang關guan,因yin此ci如ru何he一yi方fang麵mian有you效xiao解jie決jue就jiu業ye問wen題ti,另ling一yi方fang麵mian又you高gao效xiao推tui進jin機ji器qi視shi覺jiao相xiang關guan自zi動dong化hua產chan品pin設she備bei的de推tui廣guang使shi用yong,是shi政zheng府fu部bu門men、企業需要麵對的問題。”黃凱奇表示。