百川智能發布國內首個全場景深度思考模型Baichuan-M1-preview

2025-01-24 18:38:59 | 棠糖 | 2095

1月24日，百川智能正式發布國內首個全場景深度思考模型 Baichuan-M1-preview，成為目前唯一同時具備語言、視覺和搜索三大推理能力的模型。在數學、代碼等多項權威評測中，該模型表現全面超越o1-preview，展現出強大的多領域推理能力。

Baichuan-M1-preview 在語言推理、視覺推理和搜索推理三大核心能力上表現出色。語言推理：在AIME、Math等數學基準測試，以及LiveCodeBench代碼任務中的成績均優于國內外同類模型，證明了其在復雜邏輯推理和精確計算上的能力。視覺推理：在MMMU-val和MathVista等權威視覺推理評測中，Baichuan-M1-preview 的表現超越了 GPT-4o、Claude3.5 Sonnet 等頭部模型，展現出卓越的多模態推理能力。

為進一步推動AI技術在醫療領域的透明化和廣泛應用，百川智能同步推出了行業首個開源醫療增強通用大模型 Baichuan-M1-14B。性能表現在cmexam、clinicalbench_hos等權威醫學評測中，Baichuan-M1-14B的成績超越了更大參數量的Qwen2.5-72B，并與o1-mini相差無幾。數據構建百川智能收集了萬億級 token 的嚴肅醫療數據，包括中英文醫學論文、真實病例、醫療問答和臨床數據等，同時生成了超千億 token 的多樣化合成數據，涵蓋復雜決策推理鏈條和問答對等形式。創新訓練方法，模型訓練分為通識提升、醫療基礎知識提升、醫療進階知識提升三個階段，結合ELO強化學習法優化思維鏈路徑，有效提升了生成質量和邏輯推理能力。

特別提醒：本網信息來自于互聯網，目的在于傳遞更多信息，并不代表本網贊同其觀點。其原創性以及文中陳述文字和內容未經本站證實，對本文以及其中全部或者部分內容、文字、圖片等內容的真實性、完整性、及時性本站不作任何保證或承諾，請自行核實相關內容。本站不承擔此類作品侵權行為的直接責任及連帶責任。如若本網有任何內容侵犯您的權益，請及時發送相關信息至bireading@163.com，本站將會在48小時內處理完畢。

最新資訊更多》

1 9款產品榮獲IFA創新獎項，追覓科技正引領全新生活體驗
2 谷歌Nano Banana圖像編輯功能爆火：單日超2億次編輯
3 螞蟻國際推出 AI 智能體支付解決方案，可識別用戶支付意圖、全流程追溯詢證
4 DeepSeek 被曝正研發新一代 AI 智能體模型
5 美團閃購宣布推出零售行業首個“退貨免運費”服務
6 《黑神話》將開官方衍生品線下店
7 谷歌Chrome 140穩定版正式發布無痕模式新增IP保護與腳本攔截能力
8 追覓發布30余款新品、十余項全球首創，勾勒全場景智能未來
9 三星Galaxy秋季新品品鑒會：AI生態全面進化，Tab S11系列領銜登場
10 索尼發布 PS Link PC 驅動程序，方便 Win PC 用戶使用 PS Link 音頻設備
11 《DOTA2》2025 年國際邀請賽 (TI14) 首日對陣出爐，9 月 4 日開戰
12 蘋果獲觸覺引擎減震新專利 iPhone抗跌落能力將迎來革新

百川智能發布國內首個全場景深度思考模型Baichuan-M1-preview

2025-01-24 18:38:59 瀏覽量： 2095 作者：棠糖

合作伙伴

關于我們
阿里云

京公網安備 11011302001633號

公眾號二維碼

京ICP備18051707號

京公網安備 11011302001633號