中國自動化學會專家谘詢工作委員會指定宣傳媒體
新聞詳情

工業與AI如何融合?浙江攻堅數據要素重構製造邏輯

http://www.kadhoai.com.cn 2026-04-07 07:48:49 來源:21世紀經濟報道

3月31日,浙江舉行浙江數商發展推進會,會上公布了浙江省高端數據標注基地試點名單、浙江省首批工業可信數據空間創新發展試點、浙江省首批工業領域重點行業高質量數據集。

(浙江省首批工業可信數據空間創新發展試點)

當前數據領域迎來諸多新進展。3月24日‌,在中國發展高層論壇2026年年會上,‌國家數據局局長劉烈宏正式將AI領域的“Token”譯為“詞元”。不久前,工信部啟動工業數據築基行動,開展麵向人工智能賦能的高質量行業數據集建設先行先試。

浙江省經濟和信息化廳副廳長董釗透露,到2027年底,浙江計劃遴選50個省級重點行業的高質量數據集,培育200個高質量數據集。浙江還將出台推進工業互聯網與人工智能融合發展的相關行動方案,探索平台+智能體等新模式,建設一批具有全國影響力的平台。開展工業領域細分行業產業大腦遴選與評估,選樹優秀行業產業大腦。

到2027年底擬培育200個高質量數據集

21世shi紀ji經jing濟ji報bao道dao記ji者zhe在zai推tui進jin會hui現xian場chang獲huo悉xi,浙zhe江jiang省sheng首shou批pi工gong業ye可ke信xin數shu據ju空kong間jian創chuang新xin發fa展zhan試shi點dian有you兩liang類lei,一yi類lei是shi行xing業ye可ke信xin數shu據ju空kong間jian,包bao括kuo流liu程cheng工gong業ye行xing業ye、消費品行業、移動通信行業、紡織服裝行業、電機行業共5個行業可信數據空間;另一類是企業可信數據空間,包括吉利集團、立訊智能可穿戴設備等5個企業可信數據空間。

浙江省首批工業領域重點行業高質量數據集包括流程行業數據集、紡織服裝行業非結構化數據集、計算機製造領域具身智能數據集等35個行業數據集。

浙江是國家“數據二十條”明確的先行先試省份,也是製造業大省、數(shu)字(zi)經(jing)濟(ji)先(xian)行(xing)省(sheng)份(fen)。董(dong)釗(zhao)在(zai)推(tui)進(jin)會(hui)上(shang)表(biao)示(shi),浙(zhe)江(jiang)今(jin)年(nian)重(zhong)點(dian)抓(zhua)企(qi)業(ye)提(ti)升(sheng)數(shu)據(ju)管(guan)理(li)能(neng)力(li),將(jiang)研(yan)究(jiu)製(zhi)定(ding)製(zhi)造(zao)業(ye)領(ling)域(yu)的(de)企(qi)業(ye)數(shu)據(ju)治(zhi)理(li)能(neng)力(li)提(ti)升(sheng)參(can)考(kao)指(zhi)引(yin),引(yin)導(dao)推(tui)動(dong)企(qi)業(ye)構(gou)建(jian)數(shu)據(ju)治(zhi)理(li)能(neng)力(li)體(ti)係(xi),探(tan)索(suo)數(shu)據(ju)應(ying)用(yong)場(chang)景(jing),開(kai)展(zhan)數(shu)據(ju)治(zhi)理(li)能(neng)力(li)評(ping)估(gu)。

董釗透露,浙江還將抓數據集建設,提升數據資源供給能力。到2027年底,浙江計劃遴選50個省級重點行業的高質量數據集,培育200個高質量數據集,選樹200個典型應用場景。

中國工業互聯網研究院院長魯春叢在主題分享中表示,人工智能正在從感知智能向認知智能、決策智能快速躍升。從產業實踐看,在推進工業智能的應用中,七分在數據,三分在模型。

在魯春叢看來,工業數據的第一大特性是多元異構,也就是數據模態多樣、格式各異;第二大特性是多級分布,包括設備、產線、車間、工廠、企業、生態等都需要數字化的基礎設施,要按照多級架構建設工業數據集;disandatexingshishenduronghe,gongyeshujubeihouyinzangzhefuzadegongyiyuanlihelaoshifudelixingjingyan,yaoxiadaliqijianshegaozhiliangdexingyeshujutixi,datongshujuji,weirengongzhinengzaigongyechangjingyingyongtigongfengfudeyangliao。

工業數據+AI釋放價值

麵向智能時代,特別是未來AI在工業的應用,如何推進工業高質量數據集建設?關鍵是,要讓AI理解數據之間的實體關係、業務邏輯和因果鏈條。

魯春叢建議搭建“1+3”體係,“1”就是建立一套能打破數據孤島的智能基礎設施,向下應對各類異構數據源和工業協議,向上支撐大模型的部署、智能體運行和業務應用的構建,中間以統一的領域模型讓AI真正理解業務。打破數據孤島這一任務,在人工智能時代不再是物理層麵的數據搬家,而是語義層麵的數據貫通。

“3”指工業高質量數據集分為三類。魯春叢解釋,第一類是產業鏈數據集,要麵向重點的產業鏈,統籌通信、算力、雲服務和工業軟件資源,打造一體化的數據基礎設施;第二類是企業級的運營數據集,打通企業研產供銷服務,以數據指導統一的決策和管理企業級的運營。

“第三類是企業生產的數據集,這是最核心、最難啃的深水區,直接反映生產製造全流程的物理狀態,包括設備運行軌跡、工藝參數、生產能力等數據,這些數據經過清洗和標注後,就是訓練工業大模型最寶貴的養料。”魯春叢說。

工業數據作為“AI燃料”如何更好地使用起來?

藍卓數字科技有限公司總裁陳玉龍分享道,“AI技術從大模型到今年OpenClaw火爆,我認為技術上已經成熟了,但是在工業領域,尤其是綠色石化領域推進還比較慢,其中大模型和人工智能的穩定性、精準性以及AI幻覺是比較大的一個問題。”

shujudeyuanshizhuangtaibingbudengtongyukeyongxing,guanjianzaiyuruherangshujutongshibeirenleihejiqilijie。chenyulongjuli,yishebeiyucexingweihuweili,xuyaozhengheduoweidushuju,baokuojiqidezhendong、噪聲、電流數值、現場設備故障的照片以及過往的維修日誌。

工廠人員依賴業務含義理解設備狀態,AI係統同樣需要這種結構化的業務邏輯來訓練模型和做出預測。陳玉龍說,“這些原始數據必須被賦予業務層麵的含義,例如震動值200或噪聲值60所代表的具體故障狀態,才能讓工廠人員理解其實際意義,同時也使AI係統能夠正確解讀數據。隻有當震動、噪聲、電流等不同類型的數據被建立起邏輯聯係,才能形成完整的故障判斷依據。”

針對工業領域數據集建設,陳玉龍強調,數據集絕對不是隻做數據的采集、彙聚和治理,貫通數據的語義和變成AI可用的數據,這部分工作更加重要。數據一定得去用,才會發現到底是不是高質量。“例如,我們現在把綠色石化行業數據集做出來,給中控的TPT大模型去使用,做過程的質量控製、生產的操作規則優化等,要持續結合場景釋放數據的價值。”

版權所有 工控網 Copyright©2026 Gkong.com, All Rights Reserved