中國自動化學會專家谘詢工作委員會指定宣傳媒體
新聞詳情

3D機器視覺的無限視界——場景爭奪戰微光將至

http://www.kadhoai.com.cn 2026-04-07 04:22:01 來源:CPS中安網

  3D所造,無限視界。

  這是另一個視界,以前我們所說機器視覺,通常是指2D的視覺係統,即通過攝像頭拍到一個平麵的照片,然後通過圖像分析或比對來識別物體,能看到物體一個平麵上特征。

  過於“平麵”的2D機器視覺,在AI初探階段和應用上半場,是主流也可發揮極大應用價值;而當轉型深水區,痛點應用場景與深挖數據價值,就難以繼任了。

  專攻場景,那為了更加透明與徹底的“開眼看世界”,3D機器視覺,隨即而至。

  01.3D機器視覺,入安防

  而關於這一切,可追本溯源。

  對於3D 的AI機器,被大眾所關注,還源於蘋果公司2017年iPhone X中首次搭載3D結(jie)構(gou)光(guang)技(ji)術(shu),其(qi)技(ji)術(shu)原(yuan)理(li)是(shi)通(tong)過(guo)近(jin)紅(hong)外(wai)激(ji)光(guang)器(qi)向(xiang)物(wu)體(ti)投(tou)射(she)具(ju)有(you)一(yi)定(ding)結(jie)構(gou)特(te)征(zheng)的(de)光(guang)線(xian),再(zai)由(you)專(zhuan)門(men)的(de)紅(hong)外(wai)攝(she)像(xiang)頭(tou)進(jin)行(xing)采(cai)集(ji)獲(huo)取(qu)物(wu)體(ti)的(de)三(san)維(wei)結(jie)構(gou),通(tong)過(guo)運(yun)算(suan)對(dui)信(xin)息(xi)進(jin)行(xing)深(shen)入(ru)處(chu)理(li)成(cheng)像(xiang)。

  該技術經過多年輪轉與進化,依然沿用至今,可見3D機器視覺技術,還是早晨七八點鍾的太陽,仍然升起中。

  除了最為人所知的結構光技術,3D機器視覺另外兩大技術方向是雙目視覺、ToF(飛行時間法)。

  之於安防,從平麵到立體的視覺革命也可追溯,雙目技術應用也在2017年左右,頭部企業的雙目攝像機初出茅廬,而發展至今連很多智能門禁產品也采用雙目技術來增加視覺的立體感。

  既然是安防行業應用最為成熟的3D機器視覺雛形,還是有必要介紹下,何為雙目視覺。

  它(ta)的(de)原(yuan)理(li)就(jiu)像(xiang)我(wo)們(men)人(ren)的(de)兩(liang)隻(zhi)眼(yan)睛(jing),用(yong)兩(liang)個(ge)視(shi)點(dian)觀(guan)察(cha)同(tong)一(yi)景(jing)物(wu),以(yi)獲(huo)取(qu)在(zai)不(bu)同(tong)視(shi)角(jiao)下(xia)的(de)感(gan)知(zhi)圖(tu)像(xiang),然(ran)後(hou)通(tong)過(guo)三(san)角(jiao)測(ce)量(liang)原(yuan)理(li)計(ji)算(suan)圖(tu)像(xiang)的(de)視(shi)差(cha),來(lai)獲(huo)取(qu)景(jing)物(wu)的(de)三(san)維(wei)信(xin)息(xi)。

  這絕非1+1=2delianggeshexiangtoujiandanduiliao,ershicongsanweijiaoduzaishijiaozhongdelitiganzhi,suoyi,henduoshuangmushexiangjijiujinjinzhishiduolegeshexiangtoudeshijiaochangjingeryi,zhejuefeibenwentantaozhichu。

  江河入海流,安防要流入AIoT汪洋大海,在機器視覺的征途,才萬裏長征第一步。

  而接下來的一步,是著力提升圖像視頻類感知的深度和緯度,一改2D時代過於依賴於光照和顏色/灰度變化,提升測量精度易受變量照明條件製約能力,同時,讓4K等超高清真正規模化,這是3D的擅長,在主動光技術、空間三維數據、背景分離等方麵帶來質變。

  那隨之而解的問題是,安防中的2D與3D場景應用,有何不同。

  其一,是光線,2D攝像頭在光線較暗的場景下成像質量非常差,尤其是需要附加類似智能分析的功能時,分析效率存在較大問題,會有很多錯檢、漏檢,雖然會有紅外光進行補充,但實際上在紅外上做智能分析會缺失很多信息。

  其二,是人體特征檢測,2D隻有XY這樣的平麵信息,缺乏深度數據,無法對目標進行精準定位與持續跟蹤。

  最後,目標重疊的時候,2D攝像頭很難把分析目標從背景中分離出來。而且2D無法做活體檢測,人臉識別中,如果沒有3D的活體檢測,很容易受到照片與視頻的偽裝攻擊。

  為此,3D機器視覺入安防,視界前所未見。

  首先,3D是主動光技術,可以在完全無光照環境下正常的工作。在強光、逆光環境下也能達到較好成像效果。

  第二,可以獲取空間中的三維數據,包括尺寸測量,空間中人、車的位置,身高、體重、距離、速度等,都可以精準地計算出來。

  另外還可以進行背景分離,實現實時的、動態的人體人像摳圖,在進行智能分析時去除背景幹擾,提高算法分析準確率。

  還可以進行活體檢測與識別,在家庭安防、車內安防等私密場景中,我們隻需要一些深度信息,即可以實現這種安全監控與行為分析。

  總之,人工智能的核心任務之一就是讓機器能夠像人一樣感知世界、理解世界。

  人類對於世界的理解主要依靠視覺,視覺信息占人腦處理信息比重高達85%,聲音及其他感官占15%,處理視覺信息的神經元也在人腦中占麵積最大。

  並(bing)且(qie),人(ren)眼(yan)是(shi)非(fei)常(chang)典(dian)型(xing)的(de)三(san)維(wei)相(xiang)機(ji),人(ren)腦(nao)處(chu)理(li)的(de)也(ye)是(shi)立(li)體(ti)的(de)視(shi)覺(jiao)信(xin)息(xi),正(zheng)是(shi)由(you)於(yu)人(ren)類(lei)具(ju)備(bei)立(li)體(ti)視(shi)覺(jiao)能(neng)力(li),在(zai)生(sheng)物(wu)進(jin)化(hua)過(guo)程(cheng)中(zhong)才(cai)能(neng)躲(duo)避(bi)天(tian)敵(di)、圍捕打獵、使用工具等,實現與三維世界的準確交互。

  要yao讓rang機ji器qi像xiang人ren一yi樣yang,先xian要yao具ju備bei人ren眼yan一yi樣yang的de立li體ti感gan知zhi能neng力li,還hai要yao有you能neng夠gou處chu理li和he理li解jie三san維wei信xin息xi的de大da腦nao算suan法fa,即ji三san維wei全quan棧zhan技ji術shu的de相xiang機ji和he算suan法fa兩liang個ge方fang麵mian。

  3D機器視覺,打開新的成長空間,開啟另一個視界。

  02.一片藍海,搶票市場“入場券”

  心在桃園外,兀自笑春風,3D機器視覺以場景為靶心,技術能力的進階之風將吹滿地,看其市場,可謂“滿城盡帶黃金甲”。

  一來,新基建的幾年在疫情肆虐下,盡管AI科技向善,為戰疫寫下了濃墨重彩一筆,但3D機器視覺的應用卻鮮而有之,這一市場,仍然是方興未艾。

  多年積壓的市場痛點與剛需,在國家發布諸多利好政策下,推動3D機器視覺產業發展,同時工業製造智能化升級的市場需求旺盛,政策、需求“雙動力”打開了3D機器視覺市場藍海。

  這一片藍海,究竟有多大?據GGII數據預測,2025年中國機器視覺市場總規模將達到468.74億元,其中2D視覺市場規模將超過360億元。

  數據還顯示,2021年我國3D視覺市場增速超過100%,預計到2023年3D視覺市場規模將達到35億元左右,到2025年3D機器視覺市場規模將超過100億元。

  從數據中可以看出,2D視覺技術仍是當下主流,但3D視覺技術則是未來趨勢。

  目前,金融支付、智能門鎖、軌道交通、智能汽車等領域都對3D傳感器以及3D算法有著極大的需求,保守估計已成千億級藍海市場。

  海闊天空任魚躍,盡管是市場藍海,但謹慎者也不乏一眾,認為3D機器視覺仍然處於長尾市場,需求還需培育中。

  同時,算法的高山,還得再攀登。就像建築一幢高樓,人們在感概華麗外殼的同時,更應該注意到它打下的牢固地基。目前市麵上基於 3D 視覺的應用可千姿百態,而如何從“同質化”中獲取獨樹一幟的體驗,還得看核心功底,即背後的算法了。

  03.圍捕打獵,場景爭奪戰一觸即發

  專攻賽道後,很多3D機器視覺廠家盡管先行一步,但後繼者前仆後繼,如圍捕打獵,在場景之中,定勝負。

  其實可以看到這一市場格局或現狀,為客戶創造價值,這仿佛是每家AI企業不變的企業願景和努力方向,但真正做到的,卻並不多,這也是很多AI企業光有技術卻無場景落地的尷尬現狀。

  關於三維機器視覺在安防應用場景,從技術端可以從視頻結構化和識別技術上突破,來反哺場景,實現技術價值。

  以識別技術為例來看,3D機器視覺的這個三維不僅體現在數據收集上,在識別算法上,采用的也是針對三維數據的人臉識別算法,因此在準確率、安全性等方麵都應提升。

  作為蘋果同源結構光技術,基於結構光能夠保證在近距離情況下的極高精度,用於識別的三維深度感知技術在4K分辨率5米範圍內,精度達到1mm誤差,人臉重建精度保持在平均1.5mm以內,三維人像識別錯誤率可做到十億分之一。可以將重建精度做到毫米級,且移動設備幀率達到40幀/秒。

  這個精度,保證了可以動態采集並重建場景中的三維信息,同時提高對身份信息的采集和管控效率結構光深度感知、三維實時高精度重建、三維跟蹤識別及感知等技術方向,再進一步。

  當然,從應用端來看,智能所向往是安防業務從事後查證向事前預警前移的需求變化。

  而行業邏輯是越是高清,越是數據量豐富與立體的感知,越能為最終智能決策與分析,提供最優感知源,這也是3D機器視覺可以破局之道。

  zaizhinengshidaishuidoubukenengyijiandanqi,shengtaigongchuangyugongjian,shifangzhisihaierjiezhundelingyifaze,zhengtubuyi,chulezishenjiaqianghaideguangjieliangyou,yuzhiweiban,yirongjurong。

  除了三維機器視覺的千萬場景的遍地開花需要生態之力,在行業壁壘的破局中,也如此。

  現階段3D視覺行業的核心難點集中在產業鏈匹配並不完善,由於三維機器視覺仍屬於較前沿的技術,供應鏈匹配上存在技術難度高、標準不統一等諸多問題,整合產業鏈是3D視覺產業化應用的必要路徑。

  3D視覺技術棧和產業鏈相比2D更長,3D視覺技術棧包括深度感知、三維重建和三維應用,每個環節都有較高的技術門檻,要做3D機器視覺全棧技術的企業,隻能低作堰、淺淘灘。

  歸根結底,無限之界、無限視界,3D機器視覺場景爭奪與排位賽,必然又是一次洗禮。遠行至遠方,每一步,都鏗鏘。

版權所有 工控網 Copyright©2026 Gkong.com, All Rights Reserved