阿里云官宣開源通義千問720億參數模型
12月1日,阿里云開源通義千問720億參數模型Qwen-72B、18億參數模型Qwen-1.8B及音頻大模型Qwen-Audio。據悉,阿里云本次開源的模型中除預訓練模型外,還同步推出了對應的對話模型,面向72B、1.8B對話模型提供了4bit/8bit量化版模型,便于開發者們推理訓練。
據資料顯示,Qwen-72B是阿里云研發的通義千問大模型系列的720億參數規模的模型。Qwen-72B是基于Transformer的大語言模型, 在超大規模的預訓練數據上進行訓練得到。預訓練數據類型多樣,覆蓋廣泛,包括大量網絡文本、專業書籍、代碼等。