|
產品概述
在實際的應用中,需要采集的數據來源於其它係統(已經處理或加工過的)並存儲在多個關係型數據庫中。(例如:石油石化行業中,新原油價格及各種重要化工產品價格,原油、石腦油等源材料的進廠量累計,公司本年度的經營目標等,該部分數據分別來源於MES的生產數據庫和計劃係統的計劃數據庫)。基ji於yu此ci類lei情qing況kuang,我wo們men專zhuan門men開kai發fa了le一yi個ge數shu據ju抽chou取qu模mo塊kuai。數shu據ju抽chou取qu模mo塊kuai,將jiang多duo個ge關guan係xi型xing數shu據ju庫ku中zhong的de生sheng產chan數shu據ju按an預yu先xian配pei置zhi的de抽chou取qu策ce略lve實shi時shi抽chou取qu到dao紫zi金jin橋qiao曆li史shi數shu據ju庫ku。
抽取模塊組成:
數據抽取模塊由抽取配置和抽取執行程序兩部分組成。
第一部分數據抽取配置程序。
第二部分數據抽取運行程序。
功能概述:
1、可以與多種關係型數據庫進行鏈接。
2、集中抽取,可以把多個關係庫數據抽取到同一個實時數據庫中。
3、對列的類型進行轉換。
在將源端的表中內容複製到目標端時,可以通過配置條件將指定列(字段)映射到目標端的點參數上。
在將源端的表中內容複製到目標端時,通過配置條件可以增加一個數據列(字段),其值可以是固定值,也可以是表達式,然後映射到目標端的點參數上。
在將源端的表中內容複製到目標端時,通過配置條件可以在執行的結果集中刪除某列(原始表中的列不會被刪除),然後映射到目標端的點參數上。
在將源端的表中內容複製到目標端時,通過配置條件可以將源表中的某個列的類型、長度等等進行轉換。如將Varchar2類型轉換成Int類型等等。
在將源端的表中內容複製到目標端時,根據配置條件將源表的某個列的數據進行轉換。例如將“男”、“女”轉換成“0”、“1”。這種轉換不涉及第三張表,也就是說這種轉換是固定的。
4、自由指定“抽取頻率”和“基準時間”。
5、支持調用關係庫的存儲過程(必須有返回集)。
6、提供清除噪聲數據的功能。
產品架構
數據抽取配置的實現方式采用4層架構:用戶界麵層、業務處理層、傳輸層和數據處理層。

用戶界麵層
用戶界麵層為用戶提供簡潔友好的操作界麵。通過用戶界麵層可以方便的實現數據查看、編輯和維護等操作。用戶界麵層將各項操作指令發送給業務處理層,在收到業務處理的響應後顯示在界麵中。
業務處理層
業務處理層負責接收和處理用戶界麵層的各項操作指令,並將指令的執行結果發送回用戶界麵層。
業務處理層接收到用戶界麵層的指令後,首先對指令進行解析,部分指令直接在業務處理層完成邏輯處理;部(bu)分(fen)操(cao)作(zuo)需(xu)要(yao)將(jiang)解(jie)析(xi)後(hou)的(de)指(zhi)令(ling)通(tong)過(guo)傳(chuan)輸(shu)層(ceng)發(fa)送(song)給(gei)數(shu)據(ju)處(chu)理(li)層(ceng),在(zai)收(shou)到(dao)執(zhi)行(xing)結(jie)果(guo)後(hou)發(fa)送(song)給(gei)用(yong)戶(hu)界(jie)麵(mian)層(ceng)。業(ye)務(wu)處(chu)理(li)層(ceng)同(tong)時(shi)管(guan)理(li)組(zu)織(zhi)機(ji)構(gou)的(de)各(ge)種(zhong)內(nei)容(rong)。
傳輸層
傳輸層負責將業務處理層解析後的指令發送給數據處理層,並將數據處理層的信息返回給業務處理層。
傳chuan輸shu層ceng通tong過guo連lian接jie管guan理li模mo塊kuai與yu指zhi定ding數shu據ju源yuan進jin行xing通tong訊xun,通tong過guo用yong戶hu驗yan證zheng模mo塊kuai驗yan證zheng指zhi定ding數shu據ju源yuan用yong戶hu信xin息xi的de合he法fa性xing。在zai通tong訊xun過guo程cheng中zhong,傳chuan輸shu層ceng通tong過guo消xiao息xi隊dui列lie模mo塊kuai和he數shu據ju緩huan存cun模mo塊kuai提ti高gao通tong訊xun效xiao率lv和he增zeng強qiang係xi統tong穩wen定ding性xing。
數據處理層
數(shu)據(ju)處(chu)理(li)層(ceng)負(fu)責(ze)最(zui)終(zhong)執(zhi)行(xing)操(cao)作(zuo)指(zhi)令(ling)。在(zai)接(jie)收(shou)到(dao)操(cao)作(zuo)指(zhi)令(ling)後(hou),數(shu)據(ju)處(chu)理(li)層(ceng)與(yu)實(shi)時(shi)數(shu)據(ju)庫(ku)或(huo)配(pei)置(zhi)文(wen)件(jian)交(jiao)互(hu),最(zui)終(zhong)將(jiang)指(zhi)令(ling)執(zhi)行(xing)結(jie)果(guo)通(tong)過(guo)傳(chuan)輸(shu)層(ceng)返(fan)回(hui)給(gei)業(ye)務(wu)處(chu)理(li)層(ceng)。
“ETL數據抽取”程序,抽取過程示意圖
產品特點
數據抽取的特點可以概括為:分布部署、快速實施、維護便捷。
分布式配置:suizhefenbushijishuhefuzaijunhengjishudeguangfanyingyong,yuelaiyueduodeqingkuangxuyaoyuanchengpeizhichouquxinxi。weileshiyingzhezhongbianhua,shujuchouqucongshejizhichujicaiyongfenbushijiagou。tongguoxuanzeshujuyuandefangshi,keyizaibendishujukuxitongwanchengduizhidingshujuyuanzhongchouquxinxidepeizhi。
集中抽取:支持由多個不同種類或相同種類的關係型數據庫數據向同一個實時數據庫抽取。
清除噪聲數據:數據倉庫係統中有可能存在著大量的噪聲數據,引起的主要原因有:濫用縮寫詞、慣用語、數據輸入錯誤、重複記錄、丟失值等。即便是一個設計和規劃良好的數據庫係統,如果其中存在著大量的噪聲數據,那麼這個係統也是沒有任何意義的,因為“垃圾進,垃圾出”(garbage in, garbage out),係統根本就不可能為決策分析係統提供任何支持。為了清除噪聲數據,必須在數據庫係統中進行數據清洗。數據抽取可以通過“匹配項”來完成數據的映射,從而達到清除噪聲數據的目的。
靈活的組織管理:shujuchouqukeyianzhaoxuyaorenyizuzhicengjiguanxi。ruguofaxiancengjiguanxijianlicuowu,huoshijicengjiguanxifashenggaibianshi,xianyoudecengjibingbuxuyaoshanchu,ershitongguojiandandejianqieyuzhantiejikewancheng。
更多資訊,請登錄:www.realsoft.cc
|