英偉達發布 Llama-3.1-Nemotron-51B AI 模型創新神經架構搜索等技術讓單 H100 GPU

2024-09-25 16:21:31 | 弘樂 | 937

近日，英偉達發布博文，宣布推出 Llama-3.1-Nemotron-51B AI 模型，源自 Meta 公司的 Llama-3.1-70B，不過創新使用神經架構搜索（NAS）方法，建立了一個高度準確和高效的模型。

Llama-3.1-Nemotron-51B AI 模型基于 Meta 公司 2024 年 7 月發布的 Llama-3.1-70B 模型，共有 510 億參數。該 AI 模型主要采用了神經架構搜索（NAS）技術微調，平衡性能和效率，在高工作負荷下，只需要一片 H100 GPU 即可運行，大大降低了內存消耗、計算復雜性以及與運行此類大型模型相關的成本。

英偉達認為這種方式在保持了出色的精度前提下，顯著降低了內存占用、內存帶寬和 FLOPs，并證明可以在創建另一個更小、更快的變體來加以推廣。

相比較 Meta 的 Llama-3.1-70B 模型，Llama-3.1-Nemotron-51B 在保持了幾乎相同的精度情況下，推理速度提高了 2.2 倍。Llama-3.1-Nemotron-51B 實現了令人印象深刻的精度與效率權衡，減少了內存帶寬，降低了每秒浮點運算次數 (FLOP)，并減少了總體內存占用，同時不影響模型執行推理、總結和語言生成等復雜任務的能力。

英偉達通過采用 NAS 技術來優化推理模型，從而解決了這些問題。該團隊采用了分塊蒸餾過程，即訓練更小、更高效的學生模型（student model），以模仿更大的教師模型（teacher model）的功能。

特別提醒：本網信息來自于互聯網，目的在于傳遞更多信息，并不代表本網贊同其觀點。其原創性以及文中陳述文字和內容未經本站證實，對本文以及其中全部或者部分內容、文字、圖片等內容的真實性、完整性、及時性本站不作任何保證或承諾，請自行核實相關內容。本站不承擔此類作品侵權行為的直接責任及連帶責任。如若本網有任何內容侵犯您的權益，請及時發送相關信息至bireading@163.com，本站將會在48小時內處理完畢。

最新資訊更多》

1 百度學術全面AI化重構，打造全球首個一站式智能科研平臺
2 英偉達云游戲服務升級：GeForce NOW上線RTX 5080 SuperPOD性能層級
3 英特爾發布Game On 7029顯卡驅動，全面支持《無主之地4》等四款新游
4 《戰地風云6》正式回歸大逃殺模式：支持百人對戰
5 微信公眾號上線“智能回復”功能騰訊混元大模型支持賬號自建“數字分身”
6 《流放之路：降臨》國服開啟不刪檔測試
7 微軟宣布個人開發者可免費在Microsoft Store發布應用
8 騰訊會議上線“AI托管”功能
9 《星球大戰：亡命之徒》Switch 2版迎來首輪更新
10 谷歌Veo 3視頻生成模型全面升級：支持1080P與豎屏格式
11 阿里巴巴宣布推出全球首個基于用戶行為產生的榜單“高德掃街榜”：全力支持線下消費
12 一加宣布將引領行業進入“超高刷時代”，李杰稱高刷體驗“但用難回”

英偉達發布 Llama-3.1-Nemotron-51B AI 模型創新神經架構搜索等技術讓單 H100 GPU

2024-09-25 16:21:31 瀏覽量： 937 作者：弘樂

英偉達認為這種方式在保持了出色的精度前提下，顯著降低了內存占用、內存帶寬和 FLOPs，并證明可以在創建另一個更小、更快的變體來加以推廣。

合作伙伴

關于我們
阿里云

京公網安備 11011302001633號

公眾號二維碼

京ICP備18051707號

京公網安備 11011302001633號

欧美三级不卡/成人97视频/四虎成人精品永久免费av九九 /国产一区二区精品91 - 成人三级在线播放

英偉達發布 Llama-3.1-Nemotron-51B AI 模型 創新神經架構搜索等技術讓單 H100 GPU

英偉達發布 Llama-3.1-Nemotron-51B AI 模型創新神經架構搜索等技術讓單 H100 GPU