http://www.kadhoai.com.cn 2026-04-15 03:06:26 來源:Arm
當下,我們正處在激動人心的人工智能 (AI) 技術變革初期階段。隨著自然語言、多模態大模型以及生成式 AI 技術的加速演進,AI 正以前所未有的速度重塑各行各業。根據 IDC 的預測,全球數據量將從 2024 年的 159.2ZB 增長到 2028 年的超過 384.6ZB,年複合增長率達 24.4%。其中,到 2028 年,預計 37% 的數據將會在雲端直接產生,而其餘數據會從邊緣端和終端直接產生。
麵對邊緣數據的激增,高效的數據處理、低延遲傳輸以及智能、安全的存儲正成為行業關注的重點。未來的計算架構不僅要提供更強的算力,還必須更緊密地與存儲係統結合,以確保 AI 模型能夠高效運行,同時優化數據管理和訪問方式。
從目前的 AI 技術發展方向來看,一方麵,大模型正向通用人工智能 (AGI) 演進,探索多模態、物理 AI dengxinfangxiang,bingchixutiaozhansuanlidexinjixian。lingyifangmian,weituijindamoxingquanmianbushudejincheng,xingyekaishimaixiangshenduyouhuahechuizhilingyudingzhihua,shidamoxingnengzouruqianxingbaiye,shiyingyidongduan、邊緣計算、雲端部署等不同場景。
DeepSeek 的推出對全球 AI 市場產生了深遠影響:作為一種開放的創新技術,它不僅展示了 AI 在訓練與推理過程中的優化潛力,還極大提高了大規模部署的效率,充分證明了模型能夠在更低成本、更高效能的環境中穩定運行。這一成就對於推動 AI 在企業級應用和邊緣計算領域的大規模應用具有重要意義。
Arm 計算平台:持續促進從雲到端的 AI 優化部署
在 AI 發展的初期階段,數據中心作為模型訓練和初期推理的核心場所,正麵臨著前所未有的挑戰。傳統的標準通用芯片在處理計算密集型的 AI 工作負載時顯得力不從心,無法滿足 AI 時代對於高性能、低功耗以及靈活擴展性的迫切需求。在此背景下,Arm 計算平台憑借其先進的技術優勢,為新一代 AI 雲基礎設施的發展開辟了新的範式。從 Arm Neoverse 計算子係統 (CSS)、Arm Total Design 生態項目到芯粒係統架構 (CSA),Arm 進行了從技術到生態的整體化布局,不僅為 AI 數據中心的工作負載提供了高效、靈活且可擴展的解決方案,還幫助合作夥伴專注於產品差異化,為產品上市進程提速。
AI 推理是 AI 釋放價值的關鍵,它正迅速從雲端拓展至邊緣端,覆蓋世界的每一個角落。在邊緣 AI 領域,Arm 憑借其技術與生態的獨特優勢,不斷創新,確保智能物聯網與消費電子生態係統能在恰當的時機、於最適合的地點執行最優工作負載。
為了滿足邊緣 AI 日益攀升的 AI 工作負載需求,Arm 近期發布了以全新 Armv9 超高能效 CPU Cortex-A320 以及對 Transformer 網絡具有原生支持的 Ethos-U85 AI 加速器為核心的邊緣 AI 計算平台。該平台實現了 CPU 與 AI 加速器的深度集成。相比去年以 Cortex-M85 搭配 Ethos-U85 的平台提升了八倍的機器學習 (ML) 計算性能,帶來了顯著的 AI 計算能力突破,可賦能邊緣 AI 設備輕鬆運行超過 10 億參數的大模型。

圖:Arm 邊緣 AI 計算平台支持運行超 10 億參數的端側 AI 模型
其中,全新發布的超高能效 Cortex-A320 不僅可以為 Ethos-U85 提供更高的內存容量與帶寬,讓大模型在 Ethos-U85 上的執行如虎添翼,還支持更大的可尋址內存空間,並能夠更靈活地管理多層次內存訪問延遲。Cortex-A320 與 Ethos-U85 的組合,是運行大模型及應對邊緣 AI 任務所帶來的內存容量及帶寬挑戰的理想選擇。
此外,Cortex-A320 還充分利用了 Armv9 增強的 AI 計算特性以及包括 Secure EL2、指針驗證/分支目標識別 (PACBTI) 以及內存標記擴展 (MTE) 等在內的安全特性。此前,這些特性已經在其他市場得到廣泛應用,而 Arm 現在將其引入了物聯網與邊緣 AI 計算領域,在提供出色且靈活 AI 性能的同時,實現對軟件負載更好的隔離與軟件內存異常的防護,提高整體係統安全性。
AI 時代的存儲發展:存儲、計算和安全能力的全麵升級
隨著 AI 計算需求的持續增長,雲邊端在對計算能力提出更高要求的同時,也對存儲係統的性能、密度、實shi時shi性xing和he功gong耗hao等deng方fang麵mian提ti出chu了le更geng嚴yan苛ke的de要yao求qiu。在zai傳chuan統tong模mo式shi下xia,計ji算suan架jia構gou往wang往wang將jiang存cun儲chu和he計ji算suan相xiang對dui分fen離li,存cun儲chu設she備bei僅jin僅jin承cheng擔dan數shu據ju存cun放fang的de角jiao色se,數shu據ju需xu要yao在zai存cun儲chu與yu計ji算suan節jie點dian之zhi間jian頻pin繁fan搬ban移yi,導dao致zhi“存儲-計算”之間的瓶頸。然而在 AI 時代,為滿足數據實時分析、智能管理及高效訪問等需求,將存儲置於離計算單元更近的地方,或讓存儲本身具備計算能力,變得尤為關鍵。這樣能夠確保 AI 任務在最合適的位置得到高效執行。
從雲到端的 AI 計算,對存儲吞吐量、延遲、能耗、安全以及諸如 Open Channel 等提升主機可管理性 (host manageability) 的需求都不盡相同。存儲控製器以及運行在存儲控製器中 Arm CPU 上的固件在支持差異化 AI 存儲需求中起到了極其重要的作用。

圖:Arm 豐富的 IP 平台解決方案為 AI 存儲提供領先的性能及能效
事實上,作為數據存儲與網絡控製的基石,Arm 一直在為全球存儲控製器和設備提供高性能、低功耗、安全可靠的解決方案,其中包括:
Arm Cortex-R 係列實時處理器擁有最快的中斷延時和實時反應速度,被廣泛應用於諸多存儲設備;
Arm Cortex-M 係列嵌入式處理器是後端閃存和媒體控製的熱門選擇,並支持自定義指令,客戶可以針對獨特 NAND 介質的深度優化來創造差異;
Arm Cortex-A 係列應用處理器以高吞吐量流水線設計、支持最高處理性能,同時擁有 ML、數據處理軟件和豐富操作係統的堅實生態支持;
Arm Ethos-U AI 加速器支持每秒 2048MACs 的 Transformer 原生加速,可以助力存儲控製器本身變得更智能;
此外,還有為數據中心量身定製的 Neoverse。我們已開始看到 CXL (Compute Express Link) 方麵的創新設計采用 Arm Coherent Mesh Network (CMN) 與 Neoverse 組合實現可“組成式”內存擴展,並融入近存儲計算的理念,減少數據搬運。
生態攜手,構建 AI 計算與存儲未來
在專注提供領先的技術和產品的同時,Arm 還致力於和生態係統合作夥伴攜手共進,共同推動存儲產業的發展。基於 Arm 架構的平台正被行業領先的存儲企業廣泛采用,以優化其存儲解決方案。例如,Solidigm 公司最新發布的 122TB PCIe SSD Solidigm™ D5-P5336 顯著提升了 AI 數據中心的能效、存儲密度和性能,其存儲控製器采用 Arm Cortex-R CPU,有效提升了讀寫的實時性和延時確定性;慧榮科技 (Silicon Motion) 麵向 AI PC 的 SM2508 主控芯片采用了 Arm Cortex-R8 與 Cortex-M0,在能效和數據吞吐上實現了突破,其 SM2264XT-AT 是業界首款車用 PCIe Gen4 主控芯片,通過增強的虛擬化來支持混合關鍵性工作負載對數據的訪問,並可節省 30% 的能耗;江波龍基於 Arm Cortex-R CPU 打造的 XP2300、ORCA 4836 以及 UNCIA 3836 固態硬盤,憑借其大容量與高性能的優勢,廣泛應用於 AI PC、服務器、雲計算、分布式存儲及邊緣計算等多個應用場景,滿足 AI 技術的本地化部署需求。
此外,在本土存儲市場,大普微、聯芸科技、憶芯科技、特納飛、得一微電子、英韌科技等領先的存儲企業,也都廣泛采用 Arm 技術打造 SSD 主控芯片與設備方案。
迄今為止,基於 Arm 架構和平台所應用的存儲設備已近 200 億台,其中包括雲和企業級 SSD、車載 SSD、消費級 SSD、硬盤驅動器和嵌入式閃存設備。目前,由 Arm 技術賦能的存儲設備持續保持在每日大約 300 萬台的出貨量。
憑借前沿的技術實力、豐富的生態布局、深厚的存儲行業積累,Arm 正繼續引領技術創新,賦能 AI 時代的計算與存儲發展。Arm 也將繼續與合作夥伴攜手,通過安全、高效的 Arm 計算平台,構建 AI 時代計算與存儲的新未來。