阿里Qwen團隊發布全新推理模型QwQ-32B

2025-03-06 11:17:15 | 探索者 | 2406

3月6日，阿里Qwen團隊正式發布他們最新的研究成果——QwQ-32B大語言模型。據介紹，這是一款擁有320億參數的模型，其性能可與具備6710億參數（其中370億被激活）的DeepSeek-R1媲美。QwQ-32B在僅有DeepSeek-R1約1/21參數量的情況下，用強化學習實現了性能上的跨越。

此外，阿里還在推理模型中集成了與Agent相關的能力，使其能夠在使用工具的同時進行批判性思考，并根據環境反饋調整推理過程。QwQ-32B 在一系列基準測試中進行了評估，測試了數學推理、編程能力和通用能力。其中，在測試數學能力的AIME24評測集上，以及評估代碼能力的LiveCodeBench中，千問QwQ-32B表現與DeepSeek-R1相當，遠勝于o1-mini及相同尺寸的R1 蒸餾模型。

同時，在由Meta首席科學家楊立昆領銜的“最難LLMs評測榜”LiveBench、谷歌等提出的指令遵循能力IFEval評測集、由加州大學伯克利分校等提出的評估準確調用函數或工具方面的BFCL測試中，千問QwQ-32B的得分均超越了DeepSeek- R1。

特別提醒：本網信息來自于互聯網，目的在于傳遞更多信息，并不代表本網贊同其觀點。其原創性以及文中陳述文字和內容未經本站證實，對本文以及其中全部或者部分內容、文字、圖片等內容的真實性、完整性、及時性本站不作任何保證或承諾，請自行核實相關內容。本站不承擔此類作品侵權行為的直接責任及連帶責任。如若本網有任何內容侵犯您的權益，請及時發送相關信息至bireading@163.com，本站將會在48小時內處理完畢。

最新資訊更多》

1 谷歌Nano Banana圖像編輯功能爆火：單日超2億次編輯
2 螞蟻國際推出 AI 智能體支付解決方案，可識別用戶支付意圖、全流程追溯詢證
3 DeepSeek 被曝正研發新一代 AI 智能體模型
4 美團閃購宣布推出零售行業首個“退貨免運費”服務
5 《黑神話》將開官方衍生品線下店
6 谷歌Chrome 140穩定版正式發布無痕模式新增IP保護與腳本攔截能力
7 追覓發布30余款新品、十余項全球首創，勾勒全場景智能未來
8 三星Galaxy秋季新品品鑒會：AI生態全面進化，Tab S11系列領銜登場
9 索尼發布 PS Link PC 驅動程序，方便 Win PC 用戶使用 PS Link 音頻設備
10 《DOTA2》2025 年國際邀請賽 (TI14) 首日對陣出爐，9 月 4 日開戰
11 蘋果獲觸覺引擎減震新專利 iPhone抗跌落能力將迎來革新
12 亞馬遜推出 AI 購物新功能 Lens Live，手機對著實物掃掃就能找同款

阿里Qwen團隊發布全新推理模型QwQ-32B

2025-03-06 11:17:15 瀏覽量： 2406 作者：探索者

合作伙伴

關于我們
阿里云

京公網安備 11011302001633號

公眾號二維碼

京ICP備18051707號

京公網安備 11011302001633號