http://www.kadhoai.com.cn 2026-04-09 20:53:32 來源:計算機世界
12月9日從國外媒體傳出消息稱,英特爾將收購圖形處理器(GPU)廠商Nvidia,目前無法確定的隻是價格問題。鑒於英特爾和Nvidia在芯片產業的地位,這一條消息很快占據了很多媒體的頭條。自從2006年7月AMD以42億美元的現金和5700萬股AMD普通股收購GPU生廠商ATI之後,已經多次爆出英特爾會收購Nvidia的消息。而今隨著GPU和CPU的融合趨勢明顯,人們似乎更有理由相信這一消息的真實性。
實際上,2009年處理器領域最重要的變化之一就是集成了圖形處理器GPU的新型處理器異軍突起,並已成為下一代通用處理器的發展方向。繼Nvidia公司和AMD公司率先采用這一結構後,英特爾公司正在加速開發采用這種結構的32納米的Westmere處理器。此外, 由於GPU理論上的浮點運算性能已經大大超越了通用處理器,CPU加上GPU已經成為超級計算發展的重要方向。引人注目的是,我國新開發成功的“天河1號”超級計算機也采用了上述的CPU加上GPU的結構。而最新的消息是,AMD本月初宣布其將剝離其生產線,而將重點轉向融合CPU與GPU為一體的Fusion芯片APU,也是這一趨勢的一個具體體現。
用GPU處理 非圖形運算
多核處理器早已成為業界的主流。但是,4核的同構處理器並不一定能發揮4倍的性能。以目前Intel功能最強的Core i7處理器為例,其結構方麵相比上代Core 2 Quad發生了天翻地覆的變化:引入三級緩存、高速QPI總線、三通道DDR3內存控製器、超線程技術和諸多內核及指令集優化等; 然而測試表明,這些技術共同作用的結果是:同頻率下i7 965的綜合性能比上代QX9770僅提升約20%,很難再有單核Pentium D到雙核Core 2 Duo那種飛躍式提升。另外,將AMD的Phenom II處理器與Phenom處理器相比,其性能的提升主要緣於45nm工藝帶來的高頻率,其中核心結構優化的貢獻僅占5%。
不久前美國Sandia國家實驗室的一項模擬測試結果表明:對於超級計算機而言,由於受存儲機製和內存帶寬的製約,8核之後的16核、32核以至於64核通用處理器可能會引起效率的大幅度下降。這說明,多核處理器核的數目並不能無限製地增加。另外,有消息說,美國Sun公司未能如期開發出16核處理器,除受並購因素影響外,也有這方麵的原因。
在這種情況下,圖形處理器GPUyijuntuqi。guoquzaichulituxingxuanranshi,genjubiaodasanweikongjiandesanjiaoxingshulianghuozaisanjiaoxingzheseshiwenliqingxidudebutong,gejichulidefuzaijianghuifashengbianhua。zaichuantongjiegouzhong,youyugejichulideyunsuandanyuanshuliangshishixianjuedingde,yinci,zaifuzaifashengbianhuadeqingkuangxia,gudingdeyunsuandanyuanshulianghuichengweizuaixitongzhengtichulinenglitigaodepingjing。
近年來,研究人員對圖形指令結構進行了深入研究。它們發現標量數據流所占比例正在逐年提升,如果還是堅持SIMD(單指令多數據流)的設計會讓效率下降。早期的GPU,針對圖形處理的關鍵計算將處理單元分為頂點著色器、光柵化引擎、紋理貼圖單元等不同部分,分別完成不同的計算任務。而新一代GPU推tui出chu了le統tong一yi渲xuan染ran結jie構gou,統tong一yi的de計ji算suan單dan元yuan取qu代dai了le上shang述shu的de不bu同tong單dan元yuan。這zhe種zhong結jie構gou集ji成cheng了le多duo個ge支zhi持chi頂ding點dian坐zuo標biao計ji算suan及ji三san角jiao形xing著zhe色se等deng多duo級ji處chu理li的de運yun算suan單dan元yuan,各ge運yun算suan單dan元yuan的de任ren務wu可ke以yi根gen據ju各ge級ji處chu理li的de負fu載zai進jin行xing調tiao整zheng。該gai統tong一yi的de計ji算suan單dan元yuan被bei稱cheng為wei統tong一yi標biao量liang著zhe色se器qi,也ye被bei稱cheng做zuo流liu處chu理li器qi。每mei個ge流liu處chu理li器qi隻zhi完wan成cheng一yi維wei標biao量liang的de操cao作zuo。
為此,研究人員對 GPU做出變革:流處理器不再針對矢量設計,而是改成標量ALU(算術邏輯運算器)單元。也就是說,把GPU的Shader(著色器)單元內部的運算器ALU完全拆散,設計成為各自獨立的流處理器,並分配相應的指令發射端和控製單元。這樣的結構在麵對任何形式的指令(包括組合指令)時,都能保證最高的執行效率。即這種結構不僅擁有很強的圖形處理能力,而且能夠處理非圖形運算指令。
新結構的出現帶動了在以浮點運算為中心的通用處理中使用GPU的研究。理論上來講,隻要是浮點運算指令都可以交給GPU來處理。為了把GPU改(gai)造(zao)成(cheng)為(wei)真(zhen)正(zheng)的(de)通(tong)用(yong)處(chu)理(li)器(qi),研(yan)究(jiu)人(ren)員(yuan)在(zai)大(da)規(gui)模(mo)擴(kuo)充(chong)流(liu)處(chu)理(li)器(qi)數(shu)量(liang)的(de)同(tong)時(shi),也(ye)對(dui)內(nei)核(he)結(jie)構(gou)進(jin)行(xing)了(le)優(you)化(hua)與(yu)改(gai)進(jin),使(shi)其(qi)更(geng)適(shi)合(he)進(jin)行(xing)超(chao)大(da)規(gui)模(mo)的(de)並(bing)行(xing)數(shu)據(ju)處(chu)理(li)。
GPU不斷進步
2006 年11月,Nvidia公司推出基於G80結構的GeForce 8800 GPU。接著,2007年5月,AMD公司發布了Radeon HD 2000係列GPU產品。這兩款產品都采用了統一渲染結構。這種結構使GPU的運算單元變得通用,並可以根據圖形渲染處理的負載,靈活地改變運算單元的任務。
在zai傳chuan統tong結jie構gou中zhong,由you於yu各ge級ji處chu理li的de運yun算suan單dan元yuan數shu量liang是shi事shi先xian決jue定ding的de,因yin此ci,在zai負fu載zai發fa生sheng變bian化hua的de情qing況kuang下xia,固gu定ding的de運yun算suan單dan元yuan數shu目mu會hui成cheng為wei阻zu礙ai係xi統tong整zheng體ti處chu理li能neng力li提ti高gao的de瓶ping頸jing。統tong一yi渲xuan染ran結jie構gou的de出chu現xian使shi得de在zai以yi浮fu點dian運yun算suan為wei中zhong心xin的de通tong用yong處chu理li中zhong也ye可ke以yi使shi用yongGPU。采用這種結構後,GPU運算單元可在每次處理時讀入指令和數據,使其通用性得到了提高。因而,可以說GPU提高了計算機的浮點運算指令的執行速度。
2008年美國克萊公司推出企業級電腦CX1,使用了Tesla C1060主板。由於該主板有圖形處理器GPU,因而顯著地提高了CX1超級電腦的運行速度。源於此,GPU也被稱為“電腦加速器”。對於浮點運算,GPU使用專門的運算器,能夠高速地進行並行處理,從而提高計算速度。以日本東京工業大學為例,2008年10月,它們采用170個C1070處理器後,將其超級電腦T SUBAME的係統綜合運行速度從每秒67兆次提高至每秒77兆次。正因為如此,有人將GPU處理器稱為加速處理器。
不過, GPU目前麵對的問題是,隻能讀取它專用的存儲器,不能讀取電腦主存儲器。GPU處理器將需要的數據複製到供GPU使用的存儲器中,並調用在GPU中執行的函數;此後,GPU根據處理器的指令對互相獨立的數據使用多個內核進行並行處理; 最後,處理器會從GPU所使用的存儲器中獲得處理結果。正因為此,在某些情況下,GPU不能充分發揮其浮點運算速度極快的優點。
如上所述,現在的GPU可以認為是一個多功能的並行計算處理器。有專家預計,至2010年末世界上大部分的PC機將采用GPU進行計算。
CPU+GPU 組合優勢明顯
CPU和GPU各有所長。一般而言,CPU擅長處理不規則數據結構和不可預測的存取模式,以及遞歸算法、分支密集型代碼和單線程程序。這類程序任務擁有複雜的指令調度、循環、分支、邏輯判斷以及執行等步驟。例如,操作係統、文字處理、交互性應用的除錯、通用計算、係統控製和虛擬化技術等係統軟件和通用應用程序等等。而GPU擅於處理規則數據結構和可預測存取模式。例如,光影處理、3D 坐標變換、油氣勘探、金融分析、醫療成像、有限元、基因分析和地理信息係統以及科學計算等方麵的應用。
盡管在不少方麵GPU表現優異,但在一段時間內,還會維持CPU與GPU各自發展的態勢,它們可以繼續在各自擅長的領域發揮作用,而未來的演進方向是相互取長補短,走向融合。從CPU角度來講,為了提高處理能力,以前是多線程,目前是多核,將來的發展方向是眾核。CPU正向不斷增加吞吐量和提高能效性的方向發展;而從GPU角度來講,其可編程性能本來是在芯片內部固化的程序,然後發展到局部可編程, 最後是完全可編程。也就是說,GPU是在提高所處理的吞吐量的同時,向通用處理的方向發展。
今後,CPU+GPU的異構計算結構將引領處理器的發展方向,這也成為下一代超級計算的發展方向。目前設計GPU+CPU架構平台的指導思想是:讓CPU的更多資源用於緩存,GPU的更多資源用於數據計算。把兩者放在一起,不但可以減小在傳輸帶寬上的花銷,還可以讓CPU和GPU這兩個PC中運算速度最快的部件互為幫襯。其原因是,CPU中的運算器通常隻有幾個ALU,而GPU中的ALU則比CPU的數目多很多。另外,CPU中高速緩存相對比較多,而GPU中的高速緩存則比CPU少很多。必要的時候,CPU可以幫助GPU分擔一部分軟件渲染工作,另一方麵GPU可以使用主流編程語言來處理通用計算問題。這就相當於CPU多了一個強大的浮點運算部件,而GPU多了一個像素處理單元。
融合產品已經出現
2009年1月美國AMD公司在“2009 CES”展覽會上展出了對抗英特爾“Atom”處理器的筆記本電腦平台“Yukon”(開發代碼)。Yukon的特點是,把微處理器“Athlon Neo”和圖形處理器“ATI Radeon X1250”集成在一個芯片中,從而充分利用了圖形處理器的運算功能。Yukonbujinweichuliqixingnengjiaoqiang,erqiezaituxingchulixingnengshangbiaoxianlianghao。youyutuxingchuliqinenggouchengshibeidizengjiachuliqideyunsuansudu,keyishuo,tuxingchuliqiyichengweixinxingchuliqide“加速器”。
2009年下半年英特爾宣布其Westmere將把以32nm工藝製造的CPU內核芯片與以45nm工藝製造的DDR3存儲器控製器電路及繪圖處理電路芯片封裝在一起,並采用多芯片模塊(MCM)封裝。Intel第一款集成圖形核心的處理器開發代號為Clarkdale。Clarkdale處理器的圖形核心部分被Intel稱為“圖形內存控製器中心”(GMCH),其圖形核心部分基於G965/GM965時代引入的統一渲染架構。
AMD公司2009年10月公布了新一代支持微軟 DirectX 11圖像標準的圖形處理器GPU。AMD一款代號為“RV870”的圖形處理器采用40納米工藝製作,其將CPU和圖形處理器集成於一個芯片之中。由於設計合理,其性能和能效比要優於傳統的通用處理器。AMD還會推出采用RV870的新一代雙芯片顯卡。AMD同時具有x86平台CPU和GPU設計能力,並很早就提出GPGPU概念,AMD的首款集成CPU和GPU的加速處理器APU將於2011年問世。由於CPU與GPU在單芯片上的集成,這款處理器將在更低的功耗下改善係統的整體性能。
另外,英特爾在剛剛過去的11月份宣布,它對淩動(Atom)處理器進行了問世以來的最大升級,把原先獨立的圖形功能集成到CPU中。這是英特爾首款在CPU中集成圖形的芯片,將用於上網本和主流筆記本。淩動處理器是英特爾采用許多新技術的低功耗產品,以45nm工藝製造,現已成為英特爾主流處理器之一。新款淩動處理器將於2009年底問世。
另一方麵,英特爾公司也在緊鑼密鼓地開發將GPU和CPU集成在一起的Larrrabee處理器,並且將其作為英特爾公司每兩年推出一代新結構處理器的按拍節發展戰略的核心產品。不過,英特爾於2009年12月宣布,其集成GPU和CPU的Larrrabee處理器將推遲至2011年在市場銷售。由於市場上有傳言英特爾會收購Nvidia,這給Larrrabee的未來蒙上了一層陰影。不過,有一點可以肯定的是,即使Larrrabee處理器不會推出,英特爾也一定會有類似產品推出,比如收購Nvidia後聯合推出這樣的產品。
CPU與GPU融合之路
● 2006 年11月,Nvidia推出GeForce 8800 GPU;2007年5月,AMD發布了Radeon HD 2000係列GPU產品。這兩款產品都采用了統一渲染結構,使GPU的運算單元變得通用。
● 2009年1月AMD展出了筆記本電腦平台“Yucon”。Yukon把微處理器和圖形處理器集成在一個芯片中,充分利用了圖形處理器的運算功能。
● 2009年下半年英特爾宣布,其Westmere將CPU內核芯片與存儲器控製器電路及繪圖處理電路芯片封裝在了一起。
● AMD公司2009年10月公布新一代支持微軟 DirectX 11圖像標準的圖形處理器GPU。
● AMD宣布其首款集成CPU和GPU的加速處理器APU將於2011年問世。
● 2009年12月英特爾宣布,其集成GPU和CPU的Larrrabee處理器將推遲至2011年發布。