通過電源管理和工作負載整合,大幅提升電信業務處理性能
對dui於yu嵌qian入ru式shi開kai發fa者zhe來lai說shuo,如ru何he在zai低di功gong耗hao和he高gao性xing能neng之zhi間jian取qu得de平ping衡heng,是shi一yi項xiang艱jian巨ju而er持chi久jiu的de工gong作zuo。而er電dian源yuan管guan理li和he工gong作zuo負fu載zai整zheng合he兩liang種zhong技ji術shu的de誕dan生sheng,正zheng是shi為wei了le幫bang助zhu供gong應ying商shang解jie決jue這zhe些xie困kun難nan與yu挑tiao戰zhan。
通過基於策略性的電源管理和動態遷移來降低能耗
根據國際能源機構(IEA)最新的報告數據來看,能源消耗正在穩步上升並且在未來的一段時間仍會持續增長。該報告還預估,到2015年,全球的能源消耗每年將以2.5%的de速su度du增zeng長chang,其qi中zhong礦kuang物wu能neng源yuan消xiao耗hao占zhan據ju了le主zhu導dao地di位wei。增zeng長chang的de部bu分fen主zhu要yao來lai自zi於yu發fa展zhan中zhong國guo家jia生sheng活huo方fang式shi的de改gai變bian,而er世shi界jie第di一yi產chan業ye將jiang持chi續xu為wei全quan球qiu能neng源yuan消xiao耗hao的de日ri益yi減jian少shao做zuo出chu貢gong獻xian。
yejielingxiandedianxinyunyingshangnianbaoxianshi,dianxinyedenengyuanxiaohaochixuzengjia,bingchuxianzaiyixieguojianengyuanxiaohaodahudemingdanshang。yinweizhexieyunyingshangchixudeyinrufuzadexinxihetongxinjishu,daozhiwaiweiyingjianshebeidexuqiushuliangjuzeng,yinciduinengyuandexuqiuyesuizhizengjia,jinerdaozhieryanghuatanpaifangliangdezengjia,tongshinenghaodecheng 本也隨之上升。但是運營商長期的財務壓力,勢必要求在降低能耗支出,同時滿足企業的社會責任需求和/或符合相應的法律法規。但是數據處理以及傳輸速率的提高,需要更多的通信設備來支持,這反過來又擴大了電信業的總體功耗。
weilehuodekechixudefazhan,dianxinyunyingshangjishebeitigongshangkaishizhujianyishidaobingjiaqiangdianyuanguanlijishudetouru,tongguozhongdiankaifanengyuanxiaolvjihua,shixianjienengjianpai。bushuyuwangluoxitongzhongdeAdvancedTCA®(ATCA)機(ji)箱(xiang),在(zai)其(qi)整(zheng)個(ge)生(sheng)命(ming)周(zhou)期(qi)中(zhong),大(da)部(bu)分(fen)二(er)氧(yang)化(hua)碳(tan)排(pai)放(fang)主(zhu)要(yao)來(lai)自(zi)於(yu)機(ji)箱(xiang)本(ben)身(shen)的(de)性(xing)能(neng)需(xu)要(yao)以(yi)及(ji)冷(leng)卻(que)散(san)熱(re)的(de)需(xu)求(qiu)。功(gong)耗(hao)則(ze)主(zhu)要(yao)來(lai)自(zi)於(yu)運(yun)營(ying)階(jie)段(duan),在(zai)此(ci)階(jie)段(duan)的(de)二(er)氧(yang)化(hua)碳(tan)排(pai)放(fang)量(liang)占(zhan)整(zheng)個(ge)產(chan)品(pin)生(sheng)命(ming)周(zhou)期(qi)總(zong)排(pai)放(fang)量(liang)的(de)80%左右。運營階段中的三個層次(輔助設備、網絡設備和能量轉換)將消耗能量,同時也是可以管理的部分。通過對相關技術的掌握,我們可以實現能耗的管理。
圖1. 僅有36%的能量消耗來自於網絡設備,如服務器、存儲設備以及網絡裝置,其中大部分的能量直接轉化為熱能,大約隻有2.4%的能量是有效輸出。如今,供應商所提供的基於ATCA架構的網絡設備都采用了提升能源效率的解決方案,可以大幅節約輔助設備及電源轉換過程中的能耗。
合理的設計對於散熱管理非常重要,通過降低CPU的利用率,電源輸出隨之減少,進而降低機房內的散熱需求。最終既降低了二氧化碳的排放,又減少了因散熱產生的能源消耗成本。
電源管理的理念和技術
duiyushebeibensheneryan,yeyouyixieshejiliniankeyiyonglaibangzhujianshaonenghao。qizhongzuiweidajiashuzhidejiushichuliqijidongtaidianyuanguanlijishu,zheshideshebeihuoxitongkeyibeishezhichengbutongdegongzuomoshi,ru:性能/按需/節能/jinji。tongguozhexiangjishu,keyiduichuliqijinxingdongtaidianyatiaojiehedongtaipinlvtiaojie,congerjinxingyouxiaodedianyuanguanli。tongguodongtaidianyatiaojiehedongtaipinlvtiaojie,chuliqidehexindianya、時shi鍾zhong頻pin率lv或huo者zhe兩liang者zhe都dou可ke以yi減jian小xiao以yi降jiang低di能neng耗hao,同tong時shi還hai能neng滿man足zu係xi統tong的de性xing能neng所suo需xu。功gong耗hao限xian製zhi功gong能neng可ke以yi讓rang係xi統tong或huo組zu件jian保bao持chi其qi能neng耗hao使shi用yong峰feng值zhi在zai設she定ding的de數shu值zhi範fan圍wei內nei (此數值通常根據實際的服務模式下的策略而定),如CPU使用率的原始數據、並發會話數量等等。
ATCA機箱級的電源管理策略包含了用於負載整合的虛擬化動態遷移,此策略可以降低能耗和相關的成本/費用。服務器管理員可以借助動態遷移將一個正在運行的虛擬設備(VM)或huo應ying用yong在zai兩liang個ge不bu同tong的de物wu理li設she備bei間jian遷qian移yi,且qie不bu會hui斷duan開kai與yu客ke戶hu端duan的de鏈lian接jie或huo應ying用yong。動dong態tai遷qian移yi最zui典dian型xing的de一yi個ge應ying用yong就jiu是shi雲yun計ji算suan中zhong的de資zi源yuan管guan理li。電dian信xin運yun營ying商shang擁yong有you的de成cheng千qian上shang萬wan個ge虛xu擬ni設she備bei(VM)都運行在其數據中心,為了節約能源和成本、負載均衡,這些電信運營商可以利用動態遷移對虛擬設備進行轉移,而無需中斷運行在這些虛擬設備中的客戶應用程序。
實時遷移的配置策略可以基於能耗感知的遷移模式和/huofuzaitiaodudemoshierding,zhequjueyushouyaomudeshijienenghaishiyouzhidefuwupinzhi。shishiqianyijienengdeguanjianshiyouxiaodiduifuwujinxingdabaobingtigonggeigengshaodewulifuwuqi,wulifuwuqishuliangdejianshaoyiweizheduidianlinengyuandexuqiujiuhuijianshao,suochanshengdereliangyesuizhijianshao,congershixianjienengdezuizhongmude。
雖然實時虛擬設備遷移具有諸多益處,如資源(CPU,內存等)defenpeihenenghaoganzhidezhenghe,danshixunishebeideqianyibenshenyexuyaoxiaohaoewaidenengliang。zengjingyouyipianguanyuxunishebeishishiqianyidexingnenghenengliangmoshidewenzhang,fabiaozaidi20屆(jie)高(gao)性(xing)能(neng)分(fen)布(bu)式(shi)計(ji)算(suan)國(guo)際(ji)研(yan)討(tao)會(hui)會(hui)議(yi)論(lun)文(wen)集(ji)上(shang),該(gai)篇(pian)文(wen)章(zhang)講(jiang)述(shu)了(le)一(yi)個(ge)測(ce)試(shi)方(fang)法(fa),用(yong)來(lai)測(ce)試(shi)實(shi)時(shi)遷(qian)移(yi)的(de)功(gong)耗(hao)。結(jie)果(guo)顯(xian)示(shi),當(dang)部(bu)署(shu)了(le)能(neng)耗(hao)感(gan)知(zhi)以(yi)及(ji)服(fu)務(wu)器(qi)整(zheng)合(he)模(mo)型(xing)後(hou),實(shi)時(shi)遷(qian)移(yi)所(suo)消(xiao)耗(hao)的(de)能(neng)量(liang)大(da)幅(fu)減(jian)少(shao)。這(zhe)種(zhong)模(mo)式(shi)引(yin)導(dao)的(de)決(jue)策(ce),大(da)幅(fu)減(jian)少(shao)了(le)72.9%的遷移成本,並且節能73.6%。
配置和控製管理策略
以電信行業為例,現今的ATCA機箱通常包括一組高品質的電源模塊以及智能風扇係統,可以用來控製溫度輸出和功耗。我們使用一個典型的ATCA機箱來做相關的測試,通過自動調整策略(根據周圍的溫度來決定風扇的轉速),風扇(整個機箱的1/8)的功耗可以減少40%。
對於機箱剩餘的7/8部分,可以通過嵌入式軟件設置每個刀片上的CPU、內存以及其他設備的頻率和工作模式,從而實現動態電源管理和/或功耗限定。通過智能固件和軟件層麵的控製部署電源管理策略,可以大幅減少能耗。
congxitongguanlidejiaodulaikan,dangxitongdegongzuofuzaiyunxingzaimanfuheshuipingzhixiashi,jiukeyianjidingcelveshixiandongtaidianyuanguanli。tongshizaifengzhiqijianyekeyishiyongdongtaidianyuanguanliyijianshaogonghao。raner,danggonghao(能量)節約模式啟用時,處理器頻率將降低,從而影響工作負載的性能和吞吐量。
功耗限定功能可以通過顯示器或製動器的內部或外部處理實現。製動器可以提升處理器的電壓或提升處理器/內存的頻率。製動器也可以“抑製”處理器,即通過注入死循環來延遲對指令的處理。當功耗限定達到時以及限定技術啟用時,工作負載的性能可能會受到影響。
嵌入式電源管理軟件
電源管理軟件的拓撲結構是由多個係統守護進程的組件構成,其中每個組件都會管理一個刀片,和一個客戶端組件。
圖2:嵌入式電源管理的基本組件
客戶端代表電源管理係統搜集與電源有關的數據。係統守護進程是加載在每一個刀片上的應用,扮演者電源管理模塊的角色。它提供了CPU、內存、硬盤、網(wang)絡(luo)和(he)虛(xu)擬(ni)化(hua)的(de)工(gong)作(zuo)方(fang)法(fa)以(yi)及(ji)功(gong)耗(hao)限(xian)定(ding)等(deng)功(gong)能(neng),在(zai)滿(man)足(zu)性(xing)能(neng)需(xu)求(qiu)的(de)前(qian)提(ti)下(xia)盡(jin)量(liang)降(jiang)低(di)功(gong)耗(hao)。實(shi)際(ji)的(de)管(guan)理(li)端(duan)可(ke)以(yi)運(yun)行(xing)在(zai)台(tai)式(shi)機(ji)或(huo)者(zhe)筆(bi)記(ji)本(ben)上(shang),通(tong)過(guo)整(zheng)合(he)並(bing)顯(xian)示(shi)輸(shu)出(chu)機(ji)箱(xiang)、板卡和傳感器(如溫度)等實際功耗的信息。
圖3:功耗限定功能實例
主動電源管理
通過策略的配置,將ATCA刀片上CPU的工作模式切換至節能或主動電源管理模式後,每個刀片的功耗相比持續運行在性能模式下減少15%(參見圖4和圖5)。每片板卡在加載服務的情況下可以節約0.4KW的功耗(參見圖5)。如果一個14槽的ATCA機框中使用了10個刀片,那每天節約的功耗大約4KW。
圖4&5:CPU在三種獨立模式下的功耗比較
動態遷移
減少功耗的另一個非常有效的方法就是隻使用必要的設備來處理相關事件。利用Erlang概率分布算法(圖表6)可以有效檢測出使用率較低的時段。
圖6:Erlang概率分布算法在電信網絡流量監測中的實例
通過上麵的圖表我們可以了解到,1點至7點期間的CPU使用率最低,然而,即使運行在省電模式下,每片板卡仍然在消耗電能。在這種情況下,每片板卡在主動電源管理的策略下會消耗90W的功耗,峰值性能時會上升至140W。解決的辦法就是利用實時遷移策略,用最少的CPU刀片在處理這些工作負載,同時將節能模式下的刀片切換到睡眠模式,這樣相比主動電源管理的模式可以節約超過25%的功耗。
通過工作負載整合提升係統性能
在工作負載和I/Ochulifangmian,muqiandeshichanghejishufazhanqushibijiaoqingxiangcaiyongjiangchuantongdewangluojiagouzhenghedaoyigetongyongpingtaihuomokuaihuadezujianshanglai,yizhichiduowangluoshebeihetigongbutongdefuwugongneng,ruyingyongchuli、控製處理、baochulihexinhaochuligongnengdeng。chuliqijiagouyijixinderuanjiankaifagongjudegongnengtisheng,rangkaifarenyuankeyihenrongyidejianggongzuofuzaizhenghedaotongyidedaopianjiagouzhong,zhexiefuzaibaohanleyingyong、控製以及包處理等。通過軟硬件的整合,可以大幅度提升性能,並使得刀片式服務器架構在包處理解決方案中的應用大幅增加。
為了說明工作負載整合的演變,我們設計了一係列的測試方法。這些測試方法是在單一平台中,通過將CPU製造商提供的DPDK整合到ATCA處理器刀片上,以此驗證處理器刀片提供的性能以及整合的IP轉發服務。比較在沒有使用Intel® DPDK做任何優化時,采用原生 Linux(Native Linux) IP轉發時的第三層轉發性能。然後,我們再分析采用Intel® DPDK技術之後所獲得的IP轉發性能提升的原因。
數據平麵開發套件
DPDK(Data Plane Development Kit,數據平麵開發套件)是一個專為x86架構處理器提供的輕量級運行環境。它提供了低功耗和Run-to-Completion(RTC,運行到完成)模式,以此最大限度的提升數據包的處理性能。而且DPDK還包含了優化的和高效的函數庫,為用戶提供豐富的選擇,例如我們熟知的環境抽象層(EAL,Environment Abstraction Layer),它負責控製低級資源並提供優化的輪詢模式驅動(PMD,Poll Mode Driver),以及更高級別應用的完整API接口,圖7為軟件層級結構圖。
圖7: Linux應用環境下的EAL和GLIBC
測試拓撲結構
為了測量ATCA處理器刀片在第三層處理和轉發IP包的速度,我們使用圖8中所示的環境進行測試。
圖8:IP轉發測試環境
我們的測試使用了ATCA處理器刀片的2個10GbE外部接口和兩個10GbE Fabric接口(總計40G),通過比較使用和未使用DPDK的結果,我們可以得出結論:在相同的硬件平台下,使用DPDK後的Linux僅用兩個CPU線程進行IP轉發的性能,與原生 Linux(Native Linux)使用全部的CPU線程進行IP轉發的性能相比,前者是後者的10倍。使用DPDK的平台,3層小數據包的轉發線速可以達到>70%。DPDK中優化過的軟件堆棧可以實現10倍性能的提升。如果在一個基於IA架構的刀片的控製層和數據層配備DPDK,就可以減少一個40G的NPU刀片。通常一個40G的GPU刀片的功耗為180W,因此通過工作負載整合可以節省56%的能耗。
從圖9可以看出,搭配DPDK後的處理器刀片的IPv4轉發性能,可以讓客戶以更好的性價比成本,將包處理應用從基於硬件的網絡處理器移植到基於x86的計算平台,同時使用同一個平台來部署不同的服務,如程序處理、控製處理和包處理服務。更多關於我們的測試過程和結果,請登錄淩華科技網站www.adlinktech.com 查詢淩華科技的技術白皮書:采用Intel® DPDK技術的淩華科技aTCA-6200刀片式服務器完美實現包轉發服務性能的提升。
圖9:采用4個10GbE的IP轉發性能比較
結論
目前有很多途徑可以優化多板卡/多處理器係統的電源使用及效率。我們已經看到了使用嵌入式電源管理、整(zheng)合(he)嵌(qian)入(ru)式(shi)電(dian)源(yuan)管(guan)理(li)的(de)動(dong)態(tai)遷(qian)移(yi)以(yi)及(ji)優(you)化(hua)吞(tun)吐(tu)量(liang)的(de)工(gong)作(zuo)負(fu)載(zai)整(zheng)合(he)等(deng)方(fang)法(fa)的(de)可(ke)能(neng)性(xing)。由(you)於(yu)每(mei)個(ge)係(xi)統(tong)的(de)配(pei)置(zhi)和(he)對(dui)工(gong)作(zuo)負(fu)載(zai)的(de)需(xu)求(qiu)都(dou)不(bu)盡(jin)相(xiang)同(tong),因(yin)此(ci)沒(mei)有(you)一(yi)個(ge)絕(jue)對(dui)的(de)解(jie)決(jue)辦(ban)法(fa)。對(dui)於(yu)每(mei)一(yi)個(ge)方(fang)案(an),都(dou)需(xu)要(yao)仔(zai)細(xi)選(xuan)擇(ze)適(shi)合(he)的(de)技(ji)術(shu)和(he)策(ce)略(lve),以(yi)滿(man)足(zu)預(yu)期(qi)的(de)吞(tun)吐(tu)量(liang)和(he)功(gong)耗(hao)。
在未來,隨著每個係統的功耗密度(瓦/立方英寸)的持續增加,必然對散熱和運營的花費造成一定的影響,因此電源管理對於電信運營商而言將仍舊是一個需要重視的問題。
關於淩華
淩華科技致力於量測、自動化及計算機通訊科技之改進及創新,提供解決方案給全球網絡電信、智能交通及電子製造客戶。憑著對專業技術的執著與實踐客戶承諾的自我要求,領先業界推出多項創新性產品,獲ISO-9001、ISO-14001、ISO-13485、台灣精品、TL9000等多項認證。淩華科技為Intel®智能係統聯盟(Intel® Intelligent Systems Alliance)會員,PICMG協會和PC/104協會可參與製定規格的會員,PXI Systems Alliance協會董事會及最高等級會員,以及AXIe聯盟戰略會員,VMEbus國際貿易協會(VITA)成員。目前在美國、新加坡、中國、日本、德國設有子公司,在印度、韓國、法國設有辦事處,為當地客戶提供快捷服務和實時支持。網址:http://www.adlinktech.com/cn 。