http://www.kadhoai.com.cn 2026-04-08 23:13:02 來源:上海證券報
作為成渝地區東數西算的深度參與者,特斯聯近期對外公布了其計算機視覺(CV)領域的多個科研突破,並有8篇論文被CVPR、TPAMI等頂級國際學術會議和期刊收錄。
此次,特斯聯在CV領域的科研突破涵蓋語義分割、圖像增強、顯著物體識別、遷移學習、行為識別等方麵。其中不少創新技術打破了現有技術上限,亦開發了數個性能更優、識別更快、效率更高的模型,這些技術研究的應用與推廣將成為特斯聯賦能城市數字化、智能化的有力保障。
在機器視覺行業產業鏈中,如上遊的光源、鏡頭、工業相機、圖像處理器、圖tu像xiang采cai集ji卡ka等deng硬ying件jian,圖tu像xiang處chu理li軟ruan件jian和he底di層ceng算suan法fa等deng軟ruan件jian係xi統tong會hui隨sui著zhe機ji器qi視shi覺jiao的de迭die代dai而er快kuai速su發fa展zhan,推tui進jin整zheng個ge產chan業ye鏈lian的de升sheng級ji。特te斯si聯lian集ji團tuan首shou席xi科ke學xue家jia兼jian特te斯si聯lian國guo際ji總zong裁cai邵shao嶺ling博bo士shi及ji其qi團tuan隊dui在zai該gai領ling域yu中zhong提ti出chu的de圖tu像xiang和he視shi頻pin的de識shi別bie和he學xue習xi各ge算suan法fa,極ji大da縮suo短duan了le訓xun練lian和he推tui理li時shi間jian,從cong圖tu像xiang識shi別bie提ti升sheng、識別效率提升以及解決數據標注瓶頸三個方麵,提升了整體視覺應用效果。
圖像識別提升方麵,團隊的技術突破主要集中在算法層麵,囊括背景消除模塊、圖(tu)像(xiang)特(te)征(zheng)突(tu)出(chu)等(deng)。這(zhe)些(xie)可(ke)以(yi)從(cong)圖(tu)像(xiang)本(ben)質(zhi)入(ru)手(shou),豐(feng)富(fu)圖(tu)像(xiang)本(ben)身(shen)信(xin)息(xi),去(qu)除(chu)多(duo)餘(yu)噪(zao)點(dian),為(wei)後(hou)續(xu)圖(tu)像(xiang)識(shi)別(bie)提(ti)供(gong)高(gao)清(qing)的(de)圖(tu)像(xiang)數(shu)據(ju),是(shi)高(gao)效(xiao)率(lv)識(shi)別(bie)的(de)基(ji)礎(chu)。更(geng)有(you)技(ji)術(shu)突(tu)破(po)采(cai)用(yong)創(chuang)新(xin)手(shou)法(fa),如(ru)加(jia)上(shang)聲(sheng)音(yin)信(xin)息(xi)來(lai)協(xie)助(zhu)識(shi)別(bie),提(ti)高(gao)信(xin)息(xi)準(zhun)確(que)度(du)。
為wei提ti高gao識shi別bie效xiao率lv,團tuan隊dui研yan究jiu出chu新xin的de算suan法fa框kuang架jia以yi及ji新xin的de采cai樣yang器qi,可ke以yi顯xian著zhu提ti高gao識shi別bie效xiao率lv,大da大da縮suo短duan訓xun練lian時shi間jian。在zai圖tu像xiang識shi別bie中zhong,快kuai速su的de識shi別bie可ke以yi提ti高gao服fu務wu質zhi量liang,減jian少shao延yan遲chi,讓rang人ren們men感gan受shou更geng智zhi能neng的de交jiao互hu。
此(ci)外(wai),特(te)斯(si)聯(lian)團(tuan)隊(dui)還(hai)解(jie)決(jue)了(le)圖(tu)像(xiang)標(biao)注(zhu)問(wen)題(ti)。數(shu)據(ju)標(biao)注(zhu)是(shi)一(yi)個(ge)重(zhong)要(yao)的(de)過(guo)程(cheng),傳(chuan)統(tong)人(ren)工(gong)數(shu)據(ju)標(biao)注(zhu)費(fei)時(shi)費(fei)力(li)。團(tuan)隊(dui)提(ti)出(chu)了(le)一(yi)種(zhong)新(xin)的(de)類(lei)別(bie)對(dui)比(bi)技(ji)術(shu)(CaCo),該技術在無監督域適應(UDA)任務的實例判別之上引入語義先驗,可以有效地用於各種視覺UDA任務。該技術構建了一個具有語義感知的字典,其中包含來自源域和目標域的樣本,每個目標樣本根據源域樣本的類別先驗分配到一個(偽)類別標簽,以便學習與UDA目標完全匹配的類別區分但域不變的表征。
與當下最先進的方法對比,簡單的CaCo技術可以實現更優越的性能表現,也可以成為現有UDA方法的補充,推廣到其他機器學習方法中去,如無監督模型適應,開放/部分集適應等。該技術解決了傳統監督學習需要大量人工標注的問題,比現有技術擁有更高的效率。