百川智能發布國內首個全場景深度思考模型Baichuan-M1-preview
1月24日,百川智能正式發布國內首個全場景深度思考模型 Baichuan-M1-preview,成為目前唯一同時具備語言、視覺和搜索三大推理能力的模型。在數學、代碼等多項權威評測中,該模型表現全面超越o1-preview,展現出強大的多領域推理能力。
Baichuan-M1-preview 在語言推理、視覺推理和搜索推理三大核心能力上表現出色。語言推理:在AIME、Math等數學基準測試,以及LiveCodeBench代碼任務中的成績均優于國內外同類模型,證明了其在復雜邏輯推理和精確計算上的能力。視覺推理:在MMMU-val和MathVista等權威視覺推理評測中,Baichuan-M1-preview 的表現超越了 GPT-4o、Claude3.5 Sonnet 等頭部模型,展現出卓越的多模態推理能力。
為進一步推動AI技術在醫療領域的透明化和廣泛應用,百川智能同步推出了行業首個開源醫療增強通用大模型 Baichuan-M1-14B。性能表現在cmexam、clinicalbench_hos等權威醫學評測中,Baichuan-M1-14B的成績超越了更大參數量的Qwen2.5-72B,并與o1-mini相差無幾。數據構建百川智能收集了萬億級 token 的嚴肅醫療數據,包括中英文醫學論文、真實病例、醫療問答和臨床數據等,同時生成了超千億 token 的多樣化合成數據,涵蓋復雜決策推理鏈條和問答對等形式。創新訓練方法,模型訓練分為通識提升、醫療基礎知識提升、醫療進階知識提升三個階段,結合ELO強化學習法優化思維鏈路徑,有效提升了生成質量和邏輯推理能力。