dcs死機現象有兩種:人機界麵死 機、控製器死機。前者比後者損失要小。控製器死機是i/o卡件安排太多或存儲器容量不夠,一旦控製器程序運行到某一位置,就停留在該位置,程序不再往下走,即使重啟也無濟於事。
人機界麵(主要是操作站)死機現象所有dcs都不同程度地存在,隻是頻繁程度不同。另外與dcsshiyongshijianchangduanyouguan。yinyingjianyinqidesiji,xianshibuzainenghuifu。rucaozuozhandianyuandianyapiandi,henrongyishicaozuozhansiji。youyuruanjianhetongxinlianxiandesulvxuanzebuheshiyinqidesijixianxiangjingyiduanshijianrengnenghuifu。caozuozhancaozuoxitongyujiankongruanjianmohebuhaoyenengyinqisiji,duiciweihurenyuanhaowubanfa,chengweiyuanfaxingsiji。youyumouxiepeizhibuheliyinfawangluodusai、內存太小等原因造成的死機,過幾分鍾後自己能恢複。
本文討論的僅限於因係統、網絡配置不合理等原因引起的死機現象,推薦一些處理辦法。
一 dcs人機界麵的死機現象
近來,由於mis係統需從dcs中讀取生產實時數據。在網絡中接進動態數據服務器,有的采用dde方式,在讀取數據較多情況下(如3000點),由於dde消耗資源較多,網絡堵塞現象就變得十分頻繁,並使得各種人機界麵的節點死機現象變得嚴重。
網絡堵塞現象的嚴重程度與多種因素相關。從操作站取數據,采用dde方式,如果取的數據在500點以下,問題還不算太大。如果取幾千點數據,操作站死機幾乎是必然的。如果把節點連到dcs的通信網絡上,從網絡接口取數據,情況要好一些。
kongzhiqibashujusongdaojiekou,renjijiemiancongwangluojiekouduqushujuyingzunshouwangluotongxinxieyi。wangluowulijiegouyouhuanxinghezongxianxingliangzhong,zongxianwangluozailuojishangyeshihuanxingde。xingxingwangluozhiyongyuxiaoxitong(100個i/o點內)。常(chang)用(yong)通(tong)信(xin)協(xie)議(yi)是(shi)廣(guang)播(bo)式(shi),網(wang)絡(luo)上(shang)的(de)節(jie)點(dian)隻(zhi)要(yao)把(ba)數(shu)據(ju)送(song)到(dao)網(wang)絡(luo)上(shang),它(ta)就(jiu)要(yao)不(bu)斷(duan)廣(guang)播(bo)數(shu)據(ju),需(xu)要(yao)數(shu)據(ju)的(de)節(jie)點(dian)就(jiu)接(jie)收(shou)數(shu)據(ju)。廣(guang)播(bo)式(shi)協(xie)議(yi)的(de)網(wang)絡(luo)除(chu)這(zhe)種(zhong)方(fang)式(shi)外(wai),還(hai)有(you)一(yi)種(zhong)方(fang)式(shi):一(yi)個(ge)節(jie)點(dian)向(xiang)網(wang)上(shang)其(qi)他(ta)節(jie)點(dian)問(wen)詢(xun)數(shu)據(ju),如(ru)其(qi)他(ta)節(jie)點(dian)沒(mei)有(you),它(ta)就(jiu)反(fan)複(fu)進(jin)行(xing)問(wen)詢(xun)直(zhi)至(zhi)讀(du)取(qu)到(dao)這(zhe)個(ge)數(shu)據(ju)。如(ru)果(guo)網(wang)絡(luo)上(shang)根(gen)本(ben)沒(mei)有(you)這(zhe)個(ge)數(shu)據(ju),就(jiu)會(hui)造(zao)成(cheng)網(wang)絡(luo)堵(du)塞(sai)。
為使運行人員熟練dcs操作站的操作,可采用仿真係統,了解dcs的鍵盤,以減少誤操作引起死機;也可了解操作站死機情況。
在dcs運行時間較長的情況下,組態隻加不減,有一部分組態實際上已沒有與真正的i/o點相連,與控製無關。在工程師站的用戶應用程序中有這樣的i/o點。動態數據服務器接入時,欲將dcsshangsuoyoushujudiandoudushangqu,yinqizhongyoudaliangshujudianwuxiaoerzaochengwangluodusai,suoyirenjijiemianjiufashengsiji。zheshikeyongnixianggongchengshizhanduqukongzhiqizhongdezutai,yuzhengxianggongchengshizhandeneirongjinxingbijiao,shanchuwuxiaodian,jiukebimianwangluodusai。
另一個應注意問題是在接入動態數據服務器時,應檢查所有接口的軟件版本是否一致,否則會影響數據傳遞。
解決網絡堵塞的第三種方法是:如(ru)果(guo)采(cai)用(yong)例(li)外(wai)報(bao)告(gao)方(fang)式(shi),可(ke)加(jia)大(da)例(li)外(wai)報(bao)告(gao)區(qu)域(yu)以(yi)減(jian)少(shao)網(wang)絡(luo)通(tong)信(xin)量(liang)。例(li)外(wai)報(bao)告(gao)是(shi)指(zhi)現(xian)場(chang)某(mou)點(dian)隻(zhi)在(zai)發(fa)生(sheng)變(bian)化(hua)時(shi)把(ba)數(shu)據(ju)送(song)到(dao)網(wang)絡(luo)上(shang)。為(wei)防(fang)止(zhi)點(dian)已(yi)壞(huai)而(er)人(ren)機(ji)界(jie)麵(mian)未(wei)知(zhi)的(de)情(qing)況(kuang),即(ji)使(shi)點(dian)不(bu)變(bian)化(hua),超(chao)過(guo)一(yi)段(duan)時(shi)間(jian)也(ye)要(yao)報(bao)告(gao)。為(wei)減(jian)少(shao)網(wang)絡(luo)上(shang)的(de)通(tong)信(xin)量(liang),把(ba)例(li)外(wai)報(bao)告(gao)的(de)兩(liang)個(ge)參(can)數(shu)都(dou)適(shi)當(dang)加(jia)大(da),也(ye)能(neng)達(da)到(dao)減(jian)少(shao)數(shu)據(ju)量(liang)的(de)目(mu)的(de)。
最近推出的通用操作站多采用windows nt/2000操作係統,監控軟件也通用,如fix、intouch等(deng)。由(you)於(yu)軟(ruan)件(jian)銷(xiao)售(shou)量(liang)大(da),存(cun)在(zai)問(wen)題(ti)較(jiao)少(shao),通(tong)用(yong)操(cao)作(zuo)站(zhan)開(kai)放(fang)性(xing)好(hao),死(si)機(ji)現(xian)象(xiang)大(da)大(da)減(jian)少(shao)。如(ru)果(guo)驅(qu)動(dong)軟(ruan)件(jian)不(bu)太(tai)好(hao),也(ye)會(hui)引(yin)起(qi)死(si)機(ji)。重(zhong)要(yao)的(de)是(shi),它(ta)無(wu)論(lun)維(wei)護(hu)成(cheng)本(ben)、備件采購都不受dcs製造廠家的限製。但為防黑客、病毒侵入,防火牆不可缺少。
二 c/s結構的人機界麵的死機現象
1. c/s結構
dcs人機界麵采用普通pc、windows操作係統以後,為增加人機界麵數量,采用c/s結構,隻要控製器上通過接口與服務器相連,服務器和客戶機上使用網絡接口適配器用電纜連接,就成為c/s結構。
客戶機共享服務器的資源。服務器通常安裝在安全場所,保存dcs控製器送來的最有價值的現場生產數據。圖1示出客戶機和服務器的連接關係。
作為服務器的計算機可能同時為幾台或十幾台客戶機服務,所以服務器須要具有比客戶機更快的處理器、較大的內存和更大的存儲空間。
客戶機是標準的pc運行windows操作係統,僅與服務器通信,不和其他客戶機通信,有自備軟件包。在作dcs操作站時,服務器和客戶機可運行同一監控軟件,以便共享服務器資源。兩者所裝軟件的區別是服務器應有dcs控製器驅動軟件而客戶機不需要。
還有一種情況是,在服務器監控軟件上安裝opc服務器,在客戶機監控軟件上安裝opc client,客戶機就可訪問服務器。如在服務器上不需用圖形方式觀察現場設備運行情況,在服務器上也可不安監控軟件,而隻安opc服務器,隻是在查找故障時,才需要顯示器。
采用c/s結構可節省dcs昂貴的網絡專用接口。為係統可靠運行,采用雙服務器冗餘運行,這就是雙機雙網。一個係統最多用到兩個專用接口。
最終用戶反映,采用多個接口的多主站結構較好,原因是服務器和客戶機安排不合適容易死機。如infi90的conductor nt和honeywell的gus在版本較低情況下都容易死機。
2. c/s結構死機現象的產生
c/s結構網絡的兩種硬件,通常稱為客戶pc和服務器。客戶pc在中央控製室,而服務器放在安全的地方。dcs操作站死機的原因錯綜複雜。本文僅限於分析由於采用c/s結構引起的死機原因,有兩種情況:
網絡的連接線和選用不合適的網絡適配器
控製器、服務器和客戶機三者之間的連接有兩種情況:一是dcs控(kong)製(zhi)器(qi)有(you)以(yi)太(tai)網(wang)接(jie)口(kou),三(san)者(zhe)用(yong)以(yi)太(tai)網(wang)交(jiao)換(huan)機(ji)來(lai)連(lian)接(jie)。交(jiao)換(huan)機(ji)有(you)多(duo)種(zhong)端(duan)口(kou),每(mei)個(ge)端(duan)口(kou)數(shu)據(ju)傳(chuan)輸(shu)速(su)率(lv)可(ke)以(yi)不(bu)等(deng)。端(duan)口(kou)數(shu)量(liang)由(you)連(lian)接(jie)的(de)計(ji)算(suan)機(ji)台(tai)數(shu)決(jue)定(ding)。交(jiao)換(huan)機(ji)主(zhu)要(yao)指(zhi)標(biao)是(shi)背(bei)板(ban)寬(kuan)度(du)和(he)存(cun)儲(chu)器(qi)大(da)小(xiao)。如(ru)果(guo)采(cai)用(yong)以(yi)太(tai)網(wang)電(dian)纜(lan)如(ru)10base、100base等的速率都可傳輸,如采用5類線隻能是10base。在圖2以yi太tai網wang的de連lian接jie是shi星xing型xing。使shi用yong離li散san的de電dian纜lan將jiang每mei台tai計ji算suan機ji連lian接jie到dao中zhong央yang連lian接jie點dian,通tong常chang稱cheng為wei網wang絡luo集ji線xian器qi。每mei台tai計ji算suan機ji使shi用yong獨du立li電dian纜lan,連lian接jie失shi敗bai隻zhi影ying響xiang有you關guan的de單dan台tai計ji算suan機ji,其qi他ta計ji算suan機ji可ke繼ji續xu運yun行xing。如ru果guo各ge台tai機ji器qi適shi配pei器qi速su率lv相xiang同tong,以yi太tai網wang星xing型xing連lian接jie通tong常chang使shi用yong10baset電纜。
kongzhiqibaxinxisonggeifuwuqi,kehujicongfuwuqiduxieshuju,youyukehujishuliangjiaoduo,ruguotamenzhijiancaiyongyiyangdelianxianjiukenengsiji。getaikehujicongfuwuqiduqudeshujukeyiyiyang,yekeyibuyiyang。yekeyishisuoyoukehujixianshineirongyiyang,duotaicaozuozhanrongyuyunxing。meitaicaozuozhanyufuwuqijiaohuandeshujujiaoduo,kecaiyong100base端口,服務器和控製器數據交換較少,該采用10base端口,客戶機之間基本不交換數據,也可采用10base端口。如果不這樣,很可能產生客戶機死機。
客戶pc和服務器的配置不合適
客戶pc的配置取決於準備使用的操作係統。如dos和windows 3.1隻要8mb內存就可運轉,而windows 9x至少要16~32mb,windows nt最少要32mb,最好是64mb,特別是windows 2000,更需要64mb內存。除內存外對windows 2000來說,應采用更快的處理機和更大空間的硬盤。
在選用客戶pc時,雖然可以比服務器的機器差一些,但內存一定要比上麵的要求還高一些。因為機器除運轉操作係統以外,還要與服務器讀寫數據。
服務器的cpu和硬盤驅動器承受網絡上所有客戶機的服務請求。服務器需要大量存儲器,比客戶機存儲器容量要高得多才行。
最好知道主板上存儲器插槽數目和支持的最大內存數量。檢查隨dcs服務器來的存儲器是如何配置的。單條64mb dimm機器比用16mb模塊插滿4個插槽的機器更容易升級。
服務器最好采用支持ecc內存的存儲器。當ecc存儲器與一個支持ecc的主板芯片組一起使用時,可糾正單個位存儲器錯誤和檢測多位存儲器錯誤。
硬盤驅動器對於服務器也很重要,連在網上的計算機都共享服務器文件,硬盤驅動器應耐用、可靠和適用於同時為多個用戶服務的。因此,采用scsi硬盤驅動器較合適。scsi驅動器有智能和較快的轉速,采用utrawidescsi時從驅動器到係統間有極高數據傳輸率。無論是ide硬盤驅動器還是scsi硬盤驅動器,都可采用raid技術,能更安全地保存數據,提高服務器質量。scsi總線可連接多台硬盤驅動器,采用一台9gb的硬盤驅動器沒有9台1gb的scsi硬盤驅動器的效率高。
市場上有一種磁盤陣列,專為服務器設計,是一種海量存儲器產品。硬盤驅動器陣列可裝入大量驅動器,用磁盤鏡像或raid提ti供gong容rong錯cuo,自zi動dong將jiang服fu務wu器qi數shu據ju的de多duo個ge拷kao貝bei存cun儲chu到dao不bu同tong硬ying盤pan驅qu動dong器qi上shang。當dang驅qu動dong器qi發fa生sheng故gu障zhang時shi,所suo有you數shu據ju依yi然ran對dui用yong戶hu有you用yong。有you些xie陣zhen列lie驅qu動dong器qi甚shen至zhi可ke熱re交jiao換huan,能neng在zai機ji器qi運yun行xing時shi更geng換huan故gu障zhang。
服務器使用的raid最好版本是raid5,能為所有現在版本的c/s網絡操作係統所支持。raid5數據“分析(stripes)到多個scsi驅動器上,使單個損壞驅動器上的內容可以從陣列中其他驅動器的信息裏重建。當一個帶熱交換驅動器和供電的服務器結合在一起時,raid5可使服務器以接近連續的24×7正常運行。
如果dcs不是采用c/s結構的操作站,因各個操作站互相獨立,隻保存一部分數據,如果是冗餘配置,可靠性已很高,就不一定采用raid技術。
dcs操作站為文件備份,可在操作站上安裝一個scsi磁帶驅動器。采用c/s結jie構gou的de,在zai服fu務wu器qi上shang最zui好hao安an裝zhuang磁ci帶dai機ji,可ke把ba用yong戶hu組zu態tai的de應ying用yong軟ruan件jian拷kao貝bei在zai磁ci帶dai機ji上shang。操cao作zuo站zhan或huo服fu務wu器qi發fa生sheng故gu障zhang時shi,能neng把ba應ying用yong程cheng序xu重zhong新xin輸shu入ru。磁ci帶dai機ji產chan品pin更geng新xin也ye較jiao快kuai,1990年左右進口dcs配備的磁帶機現在已買不到備件或磁帶,新老磁帶機和磁帶不兼容。
s9000係統控製器由兩部分組成,一塊3c905卡完成模擬量控製,另一塊plc主機lpm620-0072,主機上有以太網口,它在組成係統時,采用以太網連接,組成c/s結構。以太網連線有兩種方式,在客戶機較多情況采用集線器連接。
如果隻用1~2台操作站和1~2台控製器就把所有操作站、控製器連在公共電纜上,網上連接設備很少,也可以采用t型連接器。
服務器比客戶機包含更多驅動器,還需考慮它的電源功率和可靠性。電源很容易被忽視,如忽視電源直流輸出是否穩定,還有噪聲、雜散信號、尖峰脈衝和浪湧。電源是最容易出故障的部件之一。電子線路采用+3.3v或5v,硬盤驅動器和風扇采用+12v電壓。
有以太網的網絡適配器,也有其他網絡適配器,但都不如以太網用得多,所以價格也高。采用以太網能降低dcs成本。
三 容易產生死機的係統實例
設計一個係統,操作站采用c/s結構,連線如圖3所示。如配置8台操作站,2台服務器,下位是4台s9000控製器,需要在操作站中顯示的i/o點數為2000,控製器和服務器通過以太網通信。控製器、服務器和控製器的物理連線是通過16端口的集線器(switch hub)。16端口集線器的速率缺省值是100base。如果服務器和操作站的適配器是10base,服務器和客戶機的內存都是64kb,係統運行後死機現象較嚴重。
把服務器的一塊適配器換成100base,客戶機仍采用10base網絡適配器,把服務器內存增加到256kb、客戶機增加到128kb,情況改觀很多。
從實際情況看,服務器和操作站死機原因與服務器內存容量關係很大。64kb的內存是最基本的,它的內存應該與操作站台數有關。運行情況表明,增加一台操作站服務器至少需要增加10~30kb內存。服務器內有兩塊網絡適配器,與控製器通信的采用10base,與操作站通信的采用100base,操作站可以采用10base的適配器。連線采用普通電纜。
如果服務器軟件和操作站軟件是fix,原來s9000的操作站就是采用該軟件,操作係統是windows 3.2,死機情況不太嚴重。目前s9000係統監控軟件是專用的,該軟件可能還有一些bug,再加上網絡、內存配置不太合理,死機現象十分嚴重。
客(ke)戶(hu)機(ji)應(ying)該(gai)組(zu)態(tai)的(de)那(na)一(yi)台(tai)服(fu)務(wu)器(qi)是(shi)主(zhu)服(fu)務(wu)器(qi),另(ling)一(yi)台(tai)是(shi)從(cong)服(fu)務(wu)器(qi)。否(fou)則(ze),當(dang)一(yi)台(tai)服(fu)務(wu)器(qi)發(fa)生(sheng)故(gu)障(zhang)時(shi),另(ling)一(yi)台(tai)服(fu)務(wu)器(qi)不(bu)能(neng)很(hen)好(hao)工(gong)作(zuo)。如(ru)果(guo)有(you)3服務器的話,組態更是重要。
----------------------------------------------
此篇文章從博客轉發
原文地址:
Http://blog.gkong.com/more.asp?id=91862&Name=ranxiaoyu