中國自動化學會專家谘詢工作委員會指定宣傳媒體
新聞詳情

Arm 與阿裏巴巴合作,通過 KleidiAI 與通義千問模型的集成,加速端側多模態 AI 體驗

http://www.kadhoai.com.cn 2026-04-07 01:06:08 來源:Arm

Arm 控股有限公司(納斯達克股票代碼:ARM,以下簡稱 “Arm”)今日發布與阿裏巴巴淘天集團輕量級深度學習框架 MNN 的又一新合作。雙方經由 Arm KleidiAI 的集成,成功讓多模態人工智能 (AI) 工作負載通過阿裏巴巴經指令調整的通義千問 Qwen2-VL-2B-Instruct 模型運行在搭載 Arm CPU 的移動設備上。該版本的通義千問模型專為端側設備的圖像理解、文本到圖像的推理,以及跨多種語言的多模態生成而設計。此次的合作顯著提升了端側多模態 AI 工作負載的性能,帶來全新的用戶體驗。

Arm 終端事業部產品管理高級總監 Stefan Rosinger 表示:“我們正身處 AI 革命的浪潮之中,親眼見證了多模態 AI 模型的興起。這些模型能夠處理並理解多種數據類型,涵蓋文本、圖像、音頻、shipinjichuanganqishuju。raner,youyuyingjianbenshendedianlixianzhiheneicunyueshu,jiazhitongshichuliduozhongshujuleixingdailaidefuzaxing,zaiduanceshebeishangbushuzhexiexianjindeduomotaimoxingzhengmianlinzhebuxiaodetiaozhan。”

Arm Kleidi 成為解決這些挑戰的理想方案,它能夠為運行在 Arm CPU 上的所有 AI 推理工作負載提供無縫的性能優化。KleidiAI 是一套輕量級且高性能開源的 Arm 例程,專為 AI 加速而設計,目前已被集成到最新版本的主流端側 AI 框架中,包括 ExecuTorch、Llama.cpp、LiteRT (通過XNNPACK)和 MediaPipe,能讓數百萬名開發者無需進行額外操作,即可自動獲取 AI 性能的顯著提升。

加速端側多模態 AI 用例的響應時間

通過 KleidiAI 與 MNN 的集成,Arm 和 MNN 團隊測量了 Qwen2-VL-2B-Instruct 模型的加速性能,結果顯示在端側的關鍵 AI 多duo模mo態tai應ying用yong場chang景jing中zhong,其qi運yun行xing和he響xiang應ying速su度du均jun有you所suo提ti升sheng。這zhe一yi提ti升sheng可ke為wei阿e裏li巴ba巴ba旗qi下xia眾zhong多duo以yi客ke戶hu為wei中zhong心xin的de應ying用yong程cheng序xu帶dai來lai更geng加jia出chu色se的de用yong戶hu體ti驗yan。

這些用例響應速度的提升,得益於模型預填充(指 AI 模型在生成響應之前先對提示詞輸入進行處理)性能提升了 57% ,以及解碼(指處理提示詞後從 AI 模型生成文本的過程)性能提升了 28%。此外,KleidiAI 集成還可以通過降低多模態工作負載的總體計算成本,進一步促進端側設備上 AI 工作負載的高效處理。數百萬使用包括 MNN 框架在內的熱門 AI 框架運行應用程序與工作負載的開發者,可以在針對邊緣側設備的應用和工作負載中享受到這些性能和效率的提升。

阿裏雲通義大模型業務總經理徐棟表示:“我們非常高興看到通義千問大模型與Arm KleidiAI 及 MNN 團隊展開深度技術合作,通過 MNN 端側推理框架和 Arm KleidiAI 的(de)集(ji)成(cheng)加(jia)速(su)優(you)化(hua),成(cheng)功(gong)實(shi)現(xian)了(le)大(da)模(mo)型(xing)推(tui)理(li)延(yan)遲(chi)的(de)顯(xian)著(zhu)降(jiang)低(di)與(yu)能(neng)效(xiao)比(bi)的(de)大(da)幅(fu)提(ti)升(sheng)。此(ci)次(ci)開(kai)創(chuang)性(xing)的(de)合(he)作(zuo)不(bu)僅(jin)充(chong)分(fen)驗(yan)證(zheng)了(le)大(da)模(mo)型(xing)在(zai)移(yi)動(dong)終(zhong)端(duan)的(de)實(shi)用(yong)潛(qian)力(li),更(geng)使(shi)用(yong)戶(hu)能(neng)夠(gou)在(zai)指(zhi)尖(jian)體(ti)驗(yan)到(dao)下(xia)一(yi)代(dai) AI 的普惠價值。我們期待三方能夠持續攜手,以技術創新突破算力邊界,共同開啟端側智能新篇章。”

阿裏巴巴淘天集團業務技術 MNN 負責人薑霄棠表示:“此次 MNN 推理框架與 Arm KleidiAI zuoshendujishuronghe,zaiduancedamoxingjiasufangmianqudelequanxintupo。tongguowomenduidicengjiagoudelianheyouhua,tongyidamoxingdeduancetuilixiaolvshixiandafutisheng,chenggongkuayueleshouxiansuanliyufuza AI 能力的技術鴻溝。這一成果既是 MNN 團隊技術攻堅的結晶,更是跨界協作力量的生動詮釋。我們期待未來能持續攜手深耕端側計算生態,讓每個移動終端都能承載更流暢、更高效、更自然的 AI 體驗。”

在 MWC 上進行 KleidiAI 集成演示

在今年的世界移動通信大會 (MWC) 上,Arm 在活動展位(2 號展廳 I60 展台)展示了此次合作的成果,該演示突出了模型如何理解視覺和文本輸入的多種組合,並對圖像中的內容進行提煉說明。這項演示在搭載 MediaTek 天璣 9400 移動係統芯片 (SoC) 的智能手機上完成,包括 vivo X200係列。

實現多模態 AI 體驗的飛躍

KleidiAI 和為阿裏巴巴通義千問模型支持的 MNN 框架進行集成,成功地為運行在搭載 Arm CPU 端側的多模態 AI 工作負載帶來顯著的用戶體驗提升。這些卓越的體驗現已應用於移動設備,許多的麵向客戶的應用程序也已受惠於 KleidiAI 帶來的種種優勢。展望未來,KleidiAI 針對 AI 工作負載的無縫優化將繼續賦能開發者,助力其在端側設備上提供更加複雜的多模態體驗。這將為下一波智能計算浪潮奠定基礎,並在 AI 的持續演進中邁出令人振奮的一大步。

版權所有 工控網 Copyright©2026 Gkong.com, All Rights Reserved