中國自動化學會專家谘詢工作委員會指定宣傳媒體
新聞詳情

昆侖數據:工業大數據7大誤區

http://www.kadhoai.com.cn 2026-04-07 14:56:52 來源:文 | 首席數據科學家 田春華博士

    7個誤區,分三批,包括規劃層麵,技術路線方麵,以及執行層麵,可能遇到的問題。

  言不及義:脫離業務邏輯的數據分析是浪費

  案例:曾和合作夥伴探索過空壓機的大數據分析。在涉及到工業設備的大數據分析應用中,有很多PHM(設備健康維護管理)的案例。

  但在跳到智能運維之前,最好先討論一下預期的業務邏輯,我們的目標是做第三方運維業務(大數據用來提高維修效率),還是通過空壓機的數據,來支撐一種新的業務模式,比如供應鏈金融、業務流程優化、能效優化等。

  首先剖析一下,先不考慮現實條件,假設技術是百分之百的成功,這個技術實現之後,到底能幹嘛?

  一(yi)年(nian)的(de)這(zhe)種(zhong)壓(ya)縮(suo)機(ji),它(ta)的(de)運(yun)維(wei)成(cheng)本(ben)到(dao)底(di)是(shi)多(duo)少(shao)?如(ru)果(guo)我(wo)是(shi)這(zhe)個(ge)設(she)備(bei)製(zhi)造(zao)商(shang),我(wo)做(zuo)智(zhi)能(neng)運(yun)維(wei)到(dao)底(di)是(shi)來(lai)幫(bang)誰(shui)實(shi)現(xian)什(shen)麼(me)?我(wo)的(de)收(shou)入(ru)或(huo)者(zhe)我(wo)的(de)成(cheng)本(ben)來(lai)自(zi)於(yu)什(shen)麼(me)地(di)方(fang)?

  如(ru)果(guo)智(zhi)能(neng)運(yun)維(wei)的(de)收(shou)入(ru)包(bao)括(kuo)利(li)潤(run)率(lv)都(dou)非(fei)常(chang)低(di),整(zheng)個(ge)產(chan)業(ye)鏈(lian),整(zheng)個(ge)行(xing)業(ye)都(dou)還(hai)沒(mei)有(you)發(fa)力(li),不(bu)妨(fang)轉(zhuan)變(bian)業(ye)務(wu)邏(luo)輯(ji),不(bu)要(yao)急(ji)於(yu)模(mo)仿(fang)一(yi)些(xie)看(kan)似(si)別(bie)人(ren)在(zai)其(qi)他(ta)領(ling)域(yu)已(yi)經(jing)成(cheng)熟(shu)的(de)案(an)例(li),先(xian)靈(ling)魂(hun)拷(kao)問(wen)自(zi)己(ji)的(de)商(shang)業(ye)本(ben)質(zhi)是(shi)否(fou)合(he)理(li)。

  指雁為羹:脫離約束條件的“烏托邦”很難成功

  案例:這類問題通常出現在一些調度優化、yunchouyouhuacengmian,yijiangshengchantiaoduhuozheyunchouyouhua,dajiahenrongyidejiuxiangzuoquanjuyouhua,zheshidajiademengxiang,zhiyouquanjuyouhuacainengyoutishengdekongjian。danshixianshizhong,yaojutiwentijutifenxi,bunengtuoliwulishijiedeyueshutiaojian。

  例(li)如(ru),港(gang)口(kou)的(de)集(ji)裝(zhuang)箱(xiang)碼(ma)頭(tou),其(qi)中(zhong)一(yi)個(ge)很(hen)重(zhong)要(yao)的(de)問(wen)題(ti)就(jiu)是(shi)碼(ma)頭(tou)的(de)堆(dui)場(chang)優(you)化(hua)。因(yin)為(wei)堆(dui)場(chang)決(jue)定(ding)容(rong)量(liang),香(xiang)港(gang)的(de)碼(ma)頭(tou)是(shi)比(bi)較(jiao)擁(yong)擠(ji)的(de),做(zuo)對(dui)比(bi)優(you)化(hua)的(de)空(kong)間(jian)很(hen)大(da),效(xiao)益(yi)也(ye)大(da),我(wo)們(men)要(yao)分(fen)析(xi)船(chuan)來(lai)了(le)之(zhi)後(hou)怎(zen)麼(me)快(kuai)速(su)的(de)支(zhi)持(chi)裝(zhuang)貨(huo)、卸貨。

  但dan是shi做zuo堆dui場chang優you化hua,業ye務wu範fan圍wei到dao底di做zuo多duo大da?客ke戶hu希xi望wang做zuo端duan到dao端duan的de堆dui場chang優you化hua,一yi個ge集ji裝zhuang箱xiang來lai了le,就jiu要yao決jue定ding最zui優you位wei置zhi。這zhe裏li忽hu略lve了le,為wei了le做zuo堆dui場chang優you化hua,

  首先要有比較明確的集裝箱的到達量預測,預測必須相對準確;

  第二,我要整個裝備的維修周期數據,要獲得排班數據,要獲得船期數據等各種關聯數據;

  第三,要避免場內卡車的擁堵,如果同一艘船的所有集裝箱都放在一起,裝船時候可能會造成局部擁堵。

  xianshiqingkuangxianihennanhuodezhemequandeshuju,zhongjiandeyueshuhenduo,shouxian,liuliangyucejiuhennanzuodejingzhun。dier,chuandedaoda,anshuoyougudingdezhouqi,danshiyeyouxietianqiyinsu,youxierudangqianyiqingyinsushibuwanquankekongde。zaizhezhongqingkuangxia,ruguozuoyouhua,shijiyudaliangdejiashe,xiaoguokenenghuidayixiezhekou。

  不bu光guang在zai碼ma頭tou,其qi實shi工gong廠chang內nei的de調tiao度du優you化hua也ye是shi這zhe樣yang,我wo們men雖sui然ran追zhui求qiu全quan局ju優you化hua,但dan還hai是shi要yao考kao慮lv現xian實shi的de條tiao件jian,哪na些xie數shu據ju不bu可ke得de,包bao括kuo得de到dao之zhi後hou他ta節jie省sheng的de成cheng本ben到dao底di有you多duo高gao,都dou要yao認ren真zhen考kao慮lv,當dang然ran技ji術shu上shang肯ken定ding會hui盡jin最zui大da的de努nu力li來lai做zuo。

  空中樓閣:與組織形態失配的數據分析很難落地

  guoquwomenyezuoguoyixie,congjishushangkexing,shenzhijingduhaibucuo,liruzaishebeiguzhangzhenduanliyixiezhongdabujiandeguzhangyuce,suiranyangbenbijiaoshao,jieheyixiejiliheshujuwajuezhishi,youdeshihouhaikeyizuochulaiyigebucuodejieguo。

  但dan是shi結jie果guo落luo地di的de時shi候hou,其qi實shi大da家jia很hen沮ju喪sang,問wen題ti就jiu在zai於yu我wo就jiu發fa現xian一yi個ge問wen題ti,有you的de時shi候hou預yu示shi著zhe在zai現xian有you的de考kao核he體ti係xi下xia,可ke能neng會hui某mou種zhong程cheng度du上shang暗an示shi著zhe現xian有you的de運yun維wei團tuan隊dui做zuo的de不bu到dao位wei,過guo去qu的de定ding期qi維wei護hu做zuo的de不bu太tai好hao。這zhe時shi候hou要yao指zhi望wang現xian場chang一yi線xian團tuan隊dui給gei出chu真zhen實shi的de或huo者zhe及ji時shi的de反fan饋kui,通tong常chang很hen難nan。

  大da家jia可ke以yi聯lian想xiang一yi下xia,包bao括kuo質zhi量liang提ti升sheng等deng各ge種zhong課ke題ti都dou會hui遇yu到dao類lei似si的de問wen題ti,在zai工gong業ye以yi外wai,甚shen至zhi在zai商shang業ye裏li的de很hen多duo預yu測ce,推tui行xing的de時shi候hou也ye會hui遇yu到dao類lei似si的de問wen題ti,這zhe個ge課ke題ti正zheng好hao是shi某mou個ge部bu門men負fu責ze的de,他ta天tian天tian用yong自zi己ji經jing驗yan來lai做zuo,現xian在zai你ni用yong數shu據ju分fen析xi比bi以yi前qian更geng好hao,除chu非fei這zhe個ge項xiang目mu從cong歸gui口kou,從cong組zu織zhi形xing態tai上shang做zuo一yi定ding的de調tiao整zheng,否fou則ze通tong常chang很hen難nan讓rang他ta真zhen正zheng用yong起qi來lai。

  避實就虛:追 “時髦”,講“套路”,忘記了本來可行的做法

  例如院線的票房預測,上映之前的預測,會決定排片到底當時排多少場,排什麼時間段,到底做什麼樣的排片策略?

  當時Google發了一篇論文,說通過Googlesousuoliangkeyizhunqueyuceyigeyingpiandepiaofang,zheshiyipianyinyongdumangaodelunwen,dangshiguoneihaoduorenfeichangxingfen,danbazheyangdefangshiyingyongdaoguonei,faxianjingdubingbulixiang。qishiwomenshibanxinbanyide,yigeyingpianpiaofangdejibenmianshishenmejuedingde?

  例如,電影類型與地區的匹配度,它是恐怖片還是什麼片?院線裏麵不同的影院,比方有的是生活區的有CBD的;比方成都喜歡看古墓片,比方廣州喜歡看粵語片,上海喜歡看小資片,比方哈爾濱基本上一般是抗戰片、武(wu)打(da)片(pian)比(bi)較(jiao)好(hao),不(bu)同(tong)地(di)域(yu)的(de)人(ren)的(de)喜(xi)好(hao),是(shi)不(bu)是(shi)都(dou)反(fan)映(ying)在(zai)搜(sou)索(suo)量(liang)上(shang)?除(chu)了(le)題(ti)材(cai)之(zhi)外(wai),還(hai)有(you)演(yan)員(yuan)的(de)活(huo)躍(yue)度(du),在(zai)社(she)交(jiao)媒(mei)體(ti)的(de)活(huo)躍(yue)度(du),導(dao)演(yan)最(zui)近(jin)獲(huo)過(guo)什(shen)麼(me)獎(jiang)?包(bao)括(kuo)題(ti)材(cai)是(shi)個(ge)什(shen)麼(me)片(pian)?後(hou)來(lai)我(wo)們(men)加(jia)入(ru)了(le)很(hen)多(duo),比(bi)如(ru)地(di)理(li)信(xin)息(xi),包(bao)括(kuo)一(yi)些(xie)過(guo)去(qu)不(bu)同(tong)院(yuan)線(xian)之(zhi)間(jian)的(de)銷(xiao)售(shou)趨(qu)勢(shi),包(bao)括(kuo)在(zai)什(shen)麼(me)社(she)交(jiao)媒(mei)體(ti)上(shang)看(kan)演(yan)員(yuan)之(zhi)間(jian)的(de)影(ying)響(xiang)力(li)的(de)增(zeng)長(chang)趨(qu)勢(shi),以(yi)及(ji)導(dao)演(yan)、演員和演員之間誰和誰搭配比較好。

  我們當然希望用最簡單的方式,就能預測票房、備(bei)品(pin)備(bei)件(jian)需(xu)求(qiu),但(dan)還(hai)是(shi)要(yao)多(duo)問(wen)問(wen)本(ben)質(zhi)問(wen)題(ti),基(ji)本(ben)麵(mian)要(yao)考(kao)慮(lv)全(quan)一(yi)點(dian)。有(you)時(shi)候(hou)不(bu)是(shi)難(nan)在(zai)預(yu)測(ce)上(shang),而(er)是(shi)要(yao)考(kao)慮(lv)一(yi)些(xie)外(wai)部(bu)的(de)人(ren)為(wei)和(he)不(bu)可(ke)控(kong)的(de)影(ying)響(xiang),包(bao)括(kuo)宏(hong)觀(guan)經(jing)濟(ji)的(de)變(bian)化(hua)。

  其實數據分析最應該做的,反而是那些現實中間時不時出現,但是人的經驗又做不好,又特別期望數據能幫忙的一些場景。

  這zhe要yao求qiu我wo們men在zai數shu據ju處chu理li上shang,即ji使shi有you些xie情qing況kuang基ji於yu現xian在zai的de模mo型xing和he數shu據ju支zhi撐cheng不bu了le,也ye要yao預yu想xiang到dao這zhe些xie情qing況kuang,至zhi少shao知zhi道dao這zhe項xiang技ji術shu的de適shi用yong範fan圍wei是shi什shen麼me,而er不bu是shi做zuo了le一yi個ge在zai特te定ding情qing況kuang下xia特te別bie好hao的de東dong西xi,就jiu推tui而er廣guang之zhi。

  任ren何he模mo型xing都dou是shi物wu理li設she計ji的de一yi個ge簡jian化hua,都dou不bu可ke能neng脫tuo離li於yu物wu理li世shi界jie,現xian在zai講jiang數shu字zi孿luan生sheng體ti,也ye要yao看kan模mo型xing用yong於yu研yan發fa階jie段duan還hai是shi在zai運yun維wei階jie段duan,畢bi竟jing不bu可ke能neng有you一yi個ge模mo型xing百bai分fen之zhi百bai的de等deng於yu物wu理li世shi界jie。

  在zai現xian實shi中zhong說shuo抓zhua基ji本ben麵mian,基ji本ben麵mian是shi什shen麼me?比bi如ru做zuo大da宗zong物wu資zi的de需xu求qiu預yu測ce,就jiu要yao梳shu理li大da宗zong物wu資zi供gong和he需xu,它ta的de驅qu動dong因yin素su到dao底di是shi什shen麼me?不bu用yong特te別bie定ding量liang,先xian大da概gai把ba關guan聯lian因yin素su梳shu理li完wan。比bi如ru做zuo設she備bei的de運yun行xing優you化hua、故障監測,不要一上來就用各種複雜的公式,其實更應該了解基本量之間的影響關係、動員關係。

  閃爍其詞:在“科學”名義下,以“非科學”的態度去做“科學”的事情

  做工業數據分析,我們需要知道一個模型的使用邊界,沒有一個模型能解決所有問題,或者適用於所有情況,除非它是一個偽科學。

  做數據分析6個階段,真正耗時的是什麼?是最早的業務問題理解,這也是最關鍵的階段。當然CRISP-DM默(mo)認(ren)把(ba)社(she)會(hui)分(fen)工(gong)做(zuo)好(hao)了(le),假(jia)設(she)數(shu)據(ju)分(fen)析(xi)師(shi)隻(zhi)做(zuo)數(shu)據(ju)挖(wa)掘(jue),數(shu)據(ju)分(fen)析(xi),在(zai)現(xian)實(shi)中(zhong)間(jian)不(bu)可(ke)能(neng)這(zhe)麼(me)理(li)想(xiang),有(you)可(ke)能(neng)別(bie)人(ren)給(gei)你(ni)理(li)出(chu)來(lai)的(de)問(wen)題(ti)不(bu)一(yi)定(ding)正(zheng)確(que),在(zai)某(mou)種(zhong)程(cheng)度(du)上(shang)要(yao)重(zhong)新(xin)定(ding)義(yi)問(wen)題(ti),而(er)不(bu)隻(zhi)是(shi)理(li)解(jie)。

  當dang然ran,還hai有you一yi些xie跨kua專zhuan業ye要yao理li解jie,不bu熟shu悉xi的de領ling域yu的de背bei景jing知zhi識shi都dou非fei常chang重zhong要yao,做zuo化hua工gong連lian化hua工gong原yuan理li都dou不bu知zhi道dao,做zuo電dian力li連lian電dian力li的de基ji本ben動dong力li學xue都dou不bu知zhi道dao,去qu盲mang做zuo就jiu很hen容rong易yi挖wa出chu來lai一yi些xie常chang識shi,這zhe是shi社she會hui資zi源yuan的de一yi種zhong浪lang費fei。

  dierbijiaohaoshideshishujuzhunbei,zhengchangqingkuangxiashujuwajuefeichanghaozuo,danhenduoshihou,shujuwajuepianpianshichulinaxiekanqilaibutaizhengchang,danzaixianshizhongjianjingchangchuxiandeyixiezhuangkuang。zuoweiyigeyanjindeshujufenxishi,womenyaocongshujuzhongjian,kandaohaoduoyewuzhuanjiazaoqimeiyouxiangdaodeyixiexinhao,shenzhishitarenweibukenengzaishujuzhongchuxian,huoshitaxikongjianguan,meiyishidao,meigeijieshaodeyixieqingkuang,zhexieyoushihouhuidadayingxiangfenximoxingdezhunquedu。yaozidongzhixingdeshihou,keyongxingshifeichangzhongyaode。

  shujuzhishiyizhongbiaoxiang,zuoweishujufenxishi,womendetaidushixiangxinshuju,danshibumixinshuju,yinweishujubenshendecaijifangshikenenghuiyoupiancha,bifangyiqianjiangde「幸存者偏差」,隻有沒被打掉的飛機才飛回來了,所以我們損失了很多,薄弱環節被打掉的一些信息。

  有些數據的采集方式、caijijingdu,baokuoshujudeyangbenxuanzeshang,kenenghuigeiwomenwudao,kanqilaizuodebucuo,qishibenshenshujumeiyoufanyingwulixianshi。baokuochuanganqideanzhuangweizhi,chuanganqibenshendeceliangyuanli,kenenghuigeishujubenshendailaiyidingdeyingxiang,zheshihouxuyaobijiaojinshenheleguandetaiduquwajue,tongshiyaoxiangqitagongkeyiyangfanfutuiqiao,zheshifeichangjiujiehemonandeyigeguocheng。

  從(cong)某(mou)種(zhong)程(cheng)度(du)上(shang),數(shu)據(ju)分(fen)析(xi)的(de)整(zheng)個(ge)過(guo)程(cheng),和(he)傳(chuan)統(tong)的(de)工(gong)科(ke)工(gong)程(cheng)化(hua)方(fang)法(fa)是(shi)一(yi)樣(yang)的(de)。任(ren)何(he)東(dong)西(xi)都(dou)是(shi)基(ji)於(yu)一(yi)定(ding)的(de)假(jia)設(she)所(suo)做(zuo)出(chu)來(lai),放(fang)到(dao)一(yi)個(ge)現(xian)實(shi)中(zhong),或(huo)者(zhe)相(xiang)對(dui)客(ke)觀(guan)的(de)現(xian)實(shi)中(zhong)去(qu)驗(yan)證(zheng),驗(yan)證(zheng)完(wan)之(zhi)後(hou),反(fan)複(fu)的(de)去(qu)觀(guan)察(cha),這(zhe)樣(yang)才(cai)有(you)可(ke)能(neng)從(cong)一(yi)定(ding)規(gui)律(lv)上(shang)反(fan)映(ying)了(le)這(zhe)個(ge)物(wu)理(li)現(xian)實(shi)。

  什麼叫科學的態度,就是要反複問,任何東西都是可以被證偽或證實的,沒有什麼東西是絕對對或者絕對錯的。

  舍本從末:把一個簡單的問題複雜化

  數(shu)據(ju)分(fen)析(xi)師(shi),有(you)時(shi)候(hou)經(jing)意(yi)不(bu)經(jing)意(yi)地(di)把(ba)一(yi)個(ge)問(wen)題(ti)給(gei)複(fu)雜(za)化(hua)了(le),有(you)時(shi)候(hou)有(you)些(xie)工(gong)藝(yi)機(ji)理(li)非(fei)常(chang)簡(jian)單(dan),基(ji)本(ben)麵(mian)就(jiu)在(zai)那(na),沒(mei)必(bi)要(yao)把(ba)這(zhe)個(ge)問(wen)題(ti)拔(ba)到(dao)一(yi)個(ge)深(shen)度(du)學(xue)習(xi)或(huo)者(zhe)一(yi)個(ge)什(shen)麼(me)高(gao)深(shen)的(de)方(fang)法(fa)來(lai)做(zuo)。

  gaijiandandewentijiujiandanchuli,buyaozaibuzhongyaodedifanghuataiduoshijian,haoduoshujufenxishidoushibijiaojiaozhende,xiangwozaoqiyeshi,xizhimojiemeigaoqingchu,xinlijiubushufu。

  數據分析作為一個工程化方法,要抓大放小,在一定的時間、空間、時間、費用的約束下,做到最好。

  我(wo)以(yi)前(qian)學(xue)控(kong)製(zhi)的(de),到(dao)大(da)四(si)的(de)時(shi)候(hou),接(jie)到(dao)一(yi)個(ge)實(shi)際(ji)衛(wei)星(xing)的(de)姿(zi)態(tai)控(kong)製(zhi)項(xiang)目(mu),上(shang)來(lai)我(wo)們(men)就(jiu)列(lie)狀(zhuang)態(tai)方(fang)程(cheng)傳(chuan)遞(di)函(han)數(shu),因(yin)為(wei)衛(wei)星(xing)模(mo)型(xing)也(ye)比(bi)較(jiao)成(cheng)熟(shu),先(xian)證(zheng)明(ming)穩(wen)定(ding)性(xing),再(zai)通(tong)過(guo)根(gen)軌(gui)跡(ji)或(huo)者(zhe)是(shi)波(bo)特(te)圖(tu)設(she)計(ji)做(zuo)控(kong)製(zhi)係(xi)統(tong)的(de)設(she)計(ji)。我(wo)自(zi)己(ji)當(dang)時(shi)非(fei)常(chang)得(de)意(yi),因(yin)為(wei)上(shang)學(xue)上(shang)了(le)十(shi)幾(ji)年(nian),第(di)1次看到自己學了這麼多年的東西,終於在現實中間有點用了。

  我(wo)們(men)去(qu)跟(gen)航(hang)天(tian)的(de)專(zhuan)家(jia)交(jiao)流(liu),對(dui)方(fang)給(gei)的(de)評(ping)價(jia)也(ye)比(bi)較(jiao)高(gao),當(dang)時(shi)我(wo)問(wen),你(ni)們(men)做(zuo)衛(wei)星(xing)設(she)計(ji)的(de)時(shi)候(hou),怎(zen)麼(me)做(zuo)?他(ta)說(shuo),其(qi)實(shi)沒(mei)有(you)你(ni)考(kao)慮(lv)那(na)麼(me)複(fu)雜(za),把(ba)不(bu)重(zhong)要(yao)的(de)全(quan)忽(hu)略(lve)掉(diao),衛(wei)星(xing)三(san)個(ge)軸(zhou)都(dou)是(shi)耦(ou)合(he)的(de),你(ni)不(bu)妨(fang)假(jia)設(she)三(san)個(ge)軸(zhou)是(shi)解(jie)耦(ou)的(de),剩(sheng)下(xia)的(de)你(ni)就(jiu)把(ba)它(ta)想(xiang)象(xiang)成(cheng)一(yi)個(ge)剛(gang)體(ti),到(dao)底(di)偏(pian)了(le)幾(ji)度(du),你(ni)到(dao)底(di)多(duo)少(shao)分(fen)鍾(zhong)想(xiang)把(ba)它(ta)轉(zhuan)回(hui)來(lai)?你(ni)能(neng)加(jia)多(duo)大(da)的(de)力(li)?加(jia)多(duo)大(da)力(li),電(dian)流(liu)馬(ma)上(shang)就(jiu)轉(zhuan)換(huan)成(cheng)控(kong)製(zhi)參(can)數(shu)。星(xing)箭(jian)分(fen)離(li)之(zhi)後(hou),到(dao)底(di)噴(pen)氣(qi)怎(zen)麼(me)噴(pen)?你(ni)想(xiang)加(jia)多(duo)大(da)的(de)衝(chong)量(liang),一(yi)個(ge)衝(chong)量(liang)噴(pen)一(yi)下(xia)持(chi)續(xu)多(duo)少(shao)秒(miao),然(ran)後(hou)產(chan)生(sheng)多(duo)大(da)衝(chong)量(liang),衝(chong)量(liang)產(chan)生(sheng)多(duo)大(da)加(jia)速(su)度(du),我(wo)要(yao)多(duo)少(shao)秒(miao)糾(jiu)正(zheng)過(guo)來(lai)?基(ji)本(ben)麵(mian)就(jiu)這(zhe)麼(me)多(duo),就(jiu)這(zhe)麼(me)簡(jian)單(dan)。

  dangshiduiwochudongmandade,buyaoyishanglaijiubayixiebuzhongyaodefuzayinsudoukaolvjinqu,zhegeguannianyiluyingxiangwohoumiandeyanjiuyufenxi。dangranrenhejianhuadoushiyouqiantide,zaiweixingfangzhenlimian,zhezhongjianhuashizaixiaojiaoduhuozhejiejinwendingdeqingkuangxiashiyong,ruguodabujianfenlihuozhetaiyangnengfanbangangdakaidengdadongtaideqingkuangxia,jianhuashifeichangweixiande。

  再舉個例子,風力發電機葉片結冰,可以做成結冰檢測,在結冰嚴重,PLC警報之前,早期檢測出來;也可以做結冰預測,但這兩個問題難度差是十萬八千裏。結冰預測的前提,首先要做天氣預報。

  大da家jia也ye都dou知zhi道dao宏hong觀guan天tian氣qi預yu報bao,氣qi象xiang局ju努nu力li了le這zhe麼me多duo年nian,也ye上shang了le很hen多duo手shou段duan,在zai有you些xie地di方fang有you時shi候hou還hai是shi預yu測ce不bu準zhun。且qie不bu說shuo我wo們men要yao做zuo局ju部bu天tian氣qi預yu報bao,每mei個ge風feng機ji每mei個ge截jie麵mian都dou要yao做zuo,還hai要yao做zuo到dao以yi小xiao時shi計ji,這zhe非fei常chang難nan的de,這zhe是shi一yi個ge世shi界jie難nan題ti,非fei常chang難nan做zuo。

  womenyoushihouyouyiwuyidebayigewentifuzahua,zuojiebingjiance,qishijiukanfengjideyunxingzhuangtai,jiukantadechulihefengsudeguanxi,youmeiyouyigechixudehuanmandexiajiang,huozhezaizongheqitadeguzhangxinxi,jiunengbayigewentijianhuabushao。

  因陋就簡:數據基礎不健全,就輕易放棄

  是不是數據基礎不好,我就不要做大數據?對數據分析師來說,數據質量從來沒好過。

  我也接觸過商業的數據,銀行的數據、電信的數據稍微偏好一點,但是對我們數據分析師那種孜孜不倦的要求來講,數據質量從來沒好過,我是深有體會。

  以yi前qian在zai境jing外wai做zuo過guo一yi個ge城cheng市shi管guan網wang的de失shi效xiao預yu測ce,預yu測ce一yi個ge地di下xia水shui管guan網wang,明ming年nian哪na個ge管guan子zi可ke能neng會hui壞huai?從cong數shu據ju的de質zhi量liang講jiang,客ke戶hu非fei常chang自zi信xin,因yin為wei他ta的de信xin息xi化hua水shui平ping大da概gai領ling先xian於yu國guo內nei十shi多duo年nian。

  我需要最基本的管網的管件、管材管理,所處位置,地麵的交通數據、環境數據,包括附近有什麼建築物,他的土地利用性質,還需要天氣數據……tashuozhedouyou,yigedifangzhengfunengbameitiaodaoludejiaotongliuliang,meigedifangtudishiyongxingzhifujinyoushenmejianzhuwu,baokuozuijinyoumeiyouxiayu,shenzhizhenggeguanwangdeyaliqu,pingjunshuiyashiduoshaodounenggeichulai。

  如果單個看,每種數據缺失都不太嚴重,數據完整度能到80%。但是一旦把這些因素關聯起來,要建模型的時候,我要把管網本身的特性、土地使用性質、天氣信息、土壤的酸堿度信息等綜合來預測,這時候一一關聯起來就發現,真的有完整數據的管道,不到30%。

  這zhe其qi實shi讓rang客ke戶hu非fei常chang震zhen驚jing,數shu據ju集ji相xiang互hu孤gu立li著zhe,有you些xie字zi段duan偶ou爾er缺que一yi點dian也ye不bu明ming顯xian,但dan是shi對dui數shu據ju分fen析xi來lai說shuo,我wo要yao關guan聯lian起qi來lai看kan,要yao橫heng著zhe看kan豎shu著zhe看kan,所suo以yi我wo對dui數shu據ju質zhi量liang的de要yao求qiu非fei常chang高gao。

  從cong我wo們men數shu據ju分fen析xi來lai看kan,其qi實shi數shu據ju基ji礎chu健jian不bu健jian全quan都dou是shi相xiang對dui的de,有you些xie數shu據ju分fen析xi發fa現xian的de數shu據ju缺que失shi,也ye是shi幫bang助zhu信xin息xi化hua建jian設she來lai把ba它ta不bu斷duan的de補bu全quan的de一yi個ge過guo程cheng。有you什shen麼me樣yang的de數shu據ju做zuo什shen麼me樣yang事shi,哪na怕pa數shu據ju不bu全quan,也ye可ke以yi從cong簡jian單dan的de做zuo,從cong容rong易yi的de做zuo,從cong基ji礎chu比bi較jiao好hao的de地di方fang做zuo。

  任何一個正常的科學技術都是有邊界的,工業大數據作為一個技術,肯定有適用和不適用的範圍。

版權所有 工控網 Copyright©2026 Gkong.com, All Rights Reserved