欧美三级不卡/成人97视频/四虎成人精品永久免费av九九 /国产一区二区精品91 - 成人三级在线播放

谷歌發(fā)布Gemma 2開源AI模型 性能力壓同級(jí)、單A100/H100 GPU可運(yùn)行

2024-06-28 10:20:31   |   微觀獵人   |   759

近日,谷歌公司發(fā)布新聞稿,面向全球研究人員和開發(fā)人員發(fā)布 Gemma 2 大語(yǔ)言模型,共有 90 億參數(shù)(9B)和 270 億參數(shù)(27B)兩種大小。Gemma 2 大語(yǔ)言模型相比較第一代,推理性能更高、效率更高,并在安全性方面取得了重大進(jìn)步。

谷歌發(fā)布Gemma 2開源AI模型 性能力壓同級(jí)、單A100/H100 GPU可運(yùn)行

谷歌在新聞稿中表示,Gemma 2-27B 模型的性能媲美兩倍規(guī)模的主流模型,而且只需要一片英偉達(dá) H100 ensor Core GPU 或 TPU 主機(jī)就能實(shí)現(xiàn)這種性能,從而大大降低了部署成本。Gemma 2-9B 模型優(yōu)于 Llama 3 8B 和其他類似規(guī)模的開源模型。谷歌還計(jì)劃在未來(lái)幾個(gè)月發(fā)布參數(shù)為 26 億的 Gemma 2 模型,更適合智能手機(jī)的人工智能應(yīng)用場(chǎng)景。

谷歌表示為 Gemma 2 重新設(shè)計(jì)了整體架構(gòu),實(shí)現(xiàn)卓越的性能和推理效率。

性能優(yōu)異:

27B 版本在同規(guī)模級(jí)別中性能最佳,甚至比兩倍于其尺寸的機(jī)型更具競(jìng)爭(zhēng)力。9B 版本的性能在同類產(chǎn)品中也處于領(lǐng)先地位,超過(guò)了 Llama 3 8B 和其他同規(guī)模的開放模型。90/270 億參數(shù),谷歌發(fā)布 Gemma 2 開源 AI 模型:性能力壓同級(jí)、單 A100 / H100 GPU 可運(yùn)行

效率和成本:

27B Gemma 2 模型可在單個(gè)谷歌云 TPU 主機(jī)、英偉達(dá) A100 80GB Tensor Core GPU 或英偉達(dá) H100 Tensor Core GPU 上以全精度高效運(yùn)行推理,在保持高性能的同時(shí)大幅降低成本。這使得人工智能部署更容易實(shí)現(xiàn),預(yù)算也更合理。

跨硬件快速推理

Gemma 2 經(jīng)過(guò)優(yōu)化,可在各種硬件(從功能強(qiáng)大的游戲筆記本電腦和高端臺(tái)式機(jī)到基于云的設(shè)置)上以驚人的速度運(yùn)行。

在 Google AI Studio 中嘗試全精度的 Gemma 2,在 CPU 上使用 Gemma.cpp 的量化版本解鎖本地性能,或通過(guò) Hugging Face Transformers 在配備 NVIDIA RTX 或 GeForce RTX 的家用電腦上進(jìn)行嘗試。

特別提醒:本網(wǎng)信息來(lái)自于互聯(lián)網(wǎng),目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實(shí),對(duì)本文以及其中全部或者部分內(nèi)容、文字、圖片等內(nèi)容的真實(shí)性、完整性、及時(shí)性本站不作任何保證或承諾,請(qǐng)自行核實(shí)相關(guān)內(nèi)容。本站不承擔(dān)此類作品侵權(quán)行為的直接責(zé)任及連帶責(zé)任。如若本網(wǎng)有任何內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)發(fā)送相關(guān)信息至bireading@163.com,本站將會(huì)在48小時(shí)內(nèi)處理完畢。

谷歌發(fā)布Gemma 2開源AI模型 性能力壓同級(jí)、單A100/H100 GPU可運(yùn)行

2024-06-28 10:20:31 瀏覽量: 759 作者: 微觀獵人

近日,谷歌公司發(fā)布新聞稿,面向全球研究人員和開發(fā)人員發(fā)布 Gemma 2 大語(yǔ)言模型,共有 90 億參數(shù)(9B)和 270 億參數(shù)(27B)兩種大小。Gemma 2 大語(yǔ)言模型相比較第一代,推理性能更高、效率更高,并在安全性方面取得了重大進(jìn)步。

谷歌發(fā)布Gemma 2開源AI模型 性能力壓同級(jí)、單A100/H100 GPU可運(yùn)行

谷歌在新聞稿中表示,Gemma 2-27B 模型的性能媲美兩倍規(guī)模的主流模型,而且只需要一片英偉達(dá) H100 ensor Core GPU 或 TPU 主機(jī)就能實(shí)現(xiàn)這種性能,從而大大降低了部署成本。Gemma 2-9B 模型優(yōu)于 Llama 3 8B 和其他類似規(guī)模的開源模型。谷歌還計(jì)劃在未來(lái)幾個(gè)月發(fā)布參數(shù)為 26 億的 Gemma 2 模型,更適合智能手機(jī)的人工智能應(yīng)用場(chǎng)景。

谷歌表示為 Gemma 2 重新設(shè)計(jì)了整體架構(gòu),實(shí)現(xiàn)卓越的性能和推理效率。

性能優(yōu)異:

27B 版本在同規(guī)模級(jí)別中性能最佳,甚至比兩倍于其尺寸的機(jī)型更具競(jìng)爭(zhēng)力。9B 版本的性能在同類產(chǎn)品中也處于領(lǐng)先地位,超過(guò)了 Llama 3 8B 和其他同規(guī)模的開放模型。90/270 億參數(shù),谷歌發(fā)布 Gemma 2 開源 AI 模型:性能力壓同級(jí)、單 A100 / H100 GPU 可運(yùn)行

效率和成本:

27B Gemma 2 模型可在單個(gè)谷歌云 TPU 主機(jī)、英偉達(dá) A100 80GB Tensor Core GPU 或英偉達(dá) H100 Tensor Core GPU 上以全精度高效運(yùn)行推理,在保持高性能的同時(shí)大幅降低成本。這使得人工智能部署更容易實(shí)現(xiàn),預(yù)算也更合理。

跨硬件快速推理

Gemma 2 經(jīng)過(guò)優(yōu)化,可在各種硬件(從功能強(qiáng)大的游戲筆記本電腦和高端臺(tái)式機(jī)到基于云的設(shè)置)上以驚人的速度運(yùn)行。

在 Google AI Studio 中嘗試全精度的 Gemma 2,在 CPU 上使用 Gemma.cpp 的量化版本解鎖本地性能,或通過(guò) Hugging Face Transformers 在配備 NVIDIA RTX 或 GeForce RTX 的家用電腦上進(jìn)行嘗試。

,

Copyright ©2018 鉍讀網(wǎng) All Rights Reserved.

京ICP備18051707號(hào)

京公網(wǎng)安備 11011302001633號(hào)