Arm推出SME2技術 安卓手機AI性能將迎來飛躍
7月11日,芯片設計巨頭Arm公司昨日(7月10日)發布官方博文,宣布推出可擴展矩陣擴展2(SME2)技術,旨在加速移動設備的AI工作負載,為生成式AI應用提供更強性能支持。Arm表示,該技術無需開發者修改代碼即可集成至現有模型和應用中,未來將顯著提升安卓手機的AI體驗。
隨著生成式AI的快速發展,移動設備上的AI應用已不再局限于傳統的聊天機器人或語音助手,而是擴展到文本生成、圖像/視頻創作、數學推理、群聊摘要等復雜場景。為滿足這些需求,Arm在2022年推出的SME(可擴展矩陣擴展)基礎上,進一步升級至SME2,專注于優化矩陣數學運算,以提升AI推理效率。
Arm稱,SME2能夠實現移動端的實時AI推理,包括圖片生成、自然語言處理(NLP)等任務。例如,在配備SME2的硬件上,Google的Gemma 3模型運行速度比未搭載該技術的硬件快6倍,可在單CPU核心上1秒內完成800字文本摘要(具體測試CPU型號未披露)。
此前,SME技術主要面向服務器和工作站級處理器,而SME2則通過優化可擴展性,使其能夠部署在智能手機、平板電腦和筆記本電腦上。Arm透露,安卓系統已全面支持SME2,該技術已在Google的XNNPACK庫中啟用,并兼容llama.cpp、阿里巴巴MNN、微軟ONNX等主流AI框架。
Arm的SME2技術有望進一步推動端側AI的普及,減少對云端算力的依賴,同時提升隱私性和響應速度。隨著生成式AI向移動端滲透,智能手機廠商可能會將SME2作為下一代旗艦芯片的重要賣點。