馬斯克的xAI推出Grok-1.5 擁有更強大的推理能力
3月29日,馬斯克旗下人工智能公司 xAI 今日在其官方博客中宣布,他們正式推出了最新版本的語言模型 Grok-1.5。這一版本的 Grok-1.5 帶來了許多改進,其中包括改進的推理能力和更長的上下文長度,為用戶提供了更加強大和智能的語言處理能力。
Grok-1.5 的最顯著改進之一是其在編碼和數學相關任務中的表現。據官方測試數據顯示,在 MATH 基準測試中,Grok-1.5 取得了50.6%的成績,在 GSM8K 基準測試中取得了90%的成績,展現出了在處理數學問題上的出色能力。這些基準測試覆蓋了廣泛的小學到高中競賽問題,顯示了 Grok-1.5 在數學領域的強大表現。此外,在 HumanEval 基準測試中,評估其代碼生成和問題解決能力時,Grok-1.5 的得分達到了74.1%,進一步證明了其在語言理解和推理方面的優越性。
除了在任務表現上的提升外,Grok-1.5 還具備了更長的上下文理解能力。新版本的 Grok 能夠在其上下文窗口內處理多達128k tokens的長上下文,這相當于其上下文長度的16倍。這一改進使得 Grok 能夠更好地理解長文檔中的信息,從而提升了其在處理復雜語言任務時的效率和準確性。
據鉍讀網了解,Grok-1.5 是基于 JAX、Rust 和 Kubernetes 構建的,采用了自定義分布式訓練框架。自定義訓練協調器能夠自動檢測到有問題的節點并將其從訓練作業中剔除,以確保訓練過程的穩定性和可靠性。此外,xAI 還對檢查點、數據加載和訓練作業重新啟動進行了優化,最大限度地減少了在發生故障時的停機時間。
目前,Grok-1.5 將在未來幾天內在 xAI 的平臺上向早期測試人員和現有的 Grok 用戶推出。這一更新將為用戶提供更加強大、智能和穩定的語言處理能力,助力他們在各種復雜任務中取得更好的成果。