谷歌Gemini 2.5 Pro模型再升級:性能跑分刷新紀(jì)錄
6月6日,谷歌近日對其AI模型Gemini 2.5 Pro進(jìn)行了新一輪更新,將其預(yù)覽版升級至06-05版本,并宣布該版本在多項(xiàng)AI基準(zhǔn)測試中表現(xiàn)顯著提升。與此同時,谷歌還回應(yīng)了此前用戶對模型性能波動的反饋,優(yōu)化了生成內(nèi)容的風(fēng)格與結(jié)構(gòu),進(jìn)一步提升了交互體驗(yàn)。
根據(jù)谷歌官方數(shù)據(jù),更新后的Gemini 2.5 Pro在多個AI評測基準(zhǔn)中刷新了成績:LMArena Elo評分提升24分,顯示模型在語言理解與生成能力上的進(jìn)步。WebDevArena Elo評分大幅上漲35分,達(dá)到1443分,谷歌稱這一成績已達(dá)到“業(yè)界領(lǐng)先水平”。在GPQA(通用問題回答基準(zhǔn))和Humanity's Last Exam等高難度測試中,新版模型也展現(xiàn)出更強(qiáng)的推理與問題解決能力。
此次更新距離谷歌3月底發(fā)布Gemini 2.5 Pro僅過去兩個多月,而輕量級版本Gemini 2.5 Flash也已在4月面向全球用戶開放體驗(yàn)。盡管兩款模型仍處于預(yù)覽階段,但頻繁的迭代顯示出谷歌在AI賽道上的加速布局。
針對此前用戶反饋的“模型性能短暫下滑”問題,谷歌表示,新版Gemini 2.5 Pro已在創(chuàng)意生成和回答格式上進(jìn)行了優(yōu)化,使輸出內(nèi)容更具結(jié)構(gòu)性,同時提升了交互流暢度。