微軟發布Phi-3系列AI模型 包含三個版本
近日,微軟研究院對外發布了一份技術報告,公布了他們的 Phi-3 系列 AI 模型,其中包括 mini、small 和 medium 三個版本。這些模型分別擁有 38 億、70 億和 140 億參數。
據鉍讀網了解,微軟的 phi-3-mini 模型在擁有 38 億參數的情況下,通過對 3.3 萬億個 tokens 進行訓練,其基準跑分性能已經超出了 Mixtral 8x7B 和 GPT-3.5。這表明即使在參數較小的情況下,Phi-3-mini 也展現出了出色的性能。
微軟強調,Phi-3-mini 模型具有在手機等設備上部署的能力,這意味著用戶可以在更多的場景下使用這一先進的 AI 技術。此外,Phi-3-mini 進一步整合了嚴格過濾的網絡數據和合成數據,使其在語言理解和推理能力上能夠與更大參數的 AI 模型相媲美。
然而,微軟也承認,盡管 Phi-3-mini 在某些任務上表現出色,例如語言理解和推理,但在像 TriviaQA 等任務上,模型規模仍然存在一定的限制。除了 Phi-3-mini,微軟還公布了 phi-3-small 和 phi-3-medium 兩個模型,它們在 MMLU(Microsoft Machine Learning Utility)上的得分分別為 75.3 和 78.2。這表明即使是較小的模型也具有出色的性能表現。