阿里通義千問發布 QwQ-32B-Preview 開源 AI 推理新王
11 月 28 日,阿里通義千問正式推出全新實驗性研究模型 QwQ-32B-Preview,旨在提升人工智能在數學和編程領域的推理能力。這款模型在深度推理的復雜問題上表現卓越,不僅成為少數可與 OpenAI o1 模型匹敵的 AI,還成為第一個以 Apache 2.0 許可證開放下載的模型,為其商業化應用鋪平道路。
阿里團隊在博客中提到,QwQ 的名稱寓意“思考、質疑與理解”,象征著人類探索未知的追求。官方將其比喻為一位好奇學徒,用智慧和問題照亮通向未來的道路。QwQ-32B-Preview 配備 325 億個參數,支持處理 32000 tokens 的超長文本輸入,其開發目的是為研究者、企業及開發者提供一個強大的推理工具。
在多個權威測試基準中,QwQ-32B-Preview 展示了強大的推理和解決問題能力:MATH-500:在這一全面考察數學解題能力的評測集中,QwQ-32B-Preview 取得了 90.6% 的高分,在各類數學主題上的表現優異。
AIME:涵蓋中學數學領域的綜合測試,QwQ-32B-Preview 得分 50.0%,展現了卓越的數學推理技能。GPQA:評估科學問題解決能力的基準測試,QwQ-32B-Preview 評分 65.2%,達到研究生水平的科學推理能力。LiveCodeBench:這一基準測試模擬真實編程場景的代碼生
QwQ-32B-Preview 是首個以寬松許可證(Apache 2.0)開放的強推理模型。開發者不僅可以在生產環境中應用,還能自由調整和優化模型。這種開放模式無疑為 AI 技術的普及與創新帶來了更廣闊的空間。