騰訊公布大語言模型訓練專利 可提高模型的準確性
2025-02-08 17:31:25 |
文白不白 |
98
天眼查App顯示,2月7日,騰訊科技(深圳)有限公司申請的“大語言模型的訓練方法、裝置、計算機設備及存儲介質(zhì)”專利公布。
摘要顯示,在該方法中,通過在大語言模型的訓練過程中引入第一摘要文本和第二摘要文本,為模型訓練提供了更多可學習信息,同時由于第一摘要文本和第二摘要文本包含的信息量不同,且第一摘要文本中包含正確語句和錯誤語句,通過對同一樣本文本的兩個不同摘要文本進行對比學習,并區(qū)分學習第一摘要文本中的正確語句和錯誤語句,避免了由于摘要文本單一而導致的模型過擬合和生成不準確等問題,不僅提高了模型的泛化性能,還提高了模型的準確性。
特別提醒:本網(wǎng)信息來自于互聯(lián)網(wǎng),目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實,對本文以及其中全部或者部分內(nèi)容、文字、圖片等內(nèi)容的真實性、完整性、及時性本站不作任何保證或承諾,請自行核實相關內(nèi)容。本站不承擔此類作品侵權行為的直接責任及連帶責任。如若本網(wǎng)有任何內(nèi)容侵犯您的權益,請及時發(fā)送相關信息至bireading@163.com,本站將會在48小時內(nèi)處理完畢。