阿里通義千問 Qwen3-4B-2507 雙料更新 手機也能輕松跑
8月7日,通義千問 Qwen 發布公告,宣布推出 Qwen3-4B-Instruct-2507 和 Qwen3-4B-Thinking-2507 兩個模型,大幅提升性能。官方表示,SLM(Small Language Models)對 Agentic AI 的發展極具價值,“2507”版本的 Qwen3-4B 模型,體積小,性能強,對手機等端側硬件部署尤為友好。
據報道,在非推理(non-thinking)領域,Qwen3-4B-Instruct-2507 顯著提升通用能力,目標成為更全能的端側利器。該模型掌握更多語言和長尾知識,上下文理解擴展至 256K,小模型也能處理長文本。該模型通用能力超越了閉源的小尺寸模型 GPT-4.1-nano,性能接近等規模的 Qwen3-30B-A3B(non-thinking)。官方表示該模型更像一位高效的“執行專家”,遵循指令、迅速響應,更適合用于內容創作、工具調用等。
在推理(thinking)領域,Qwen3-4B-Thinking-2507 大幅提升了推理能力,AIME25 高達 81.3 分。Qwen3-4B-Thinking-2507 的推理表現可媲美中等模型 Qwen3-30B-Thinking,在聚焦數學能力的 AIME25 測評中,以 4B 參數量斬獲驚人的 81.3 分的好成績。官方表示該模型像一位嚴謹的“學術專家”,面對復雜問題逐步推理,完成任務更深入可靠。