英偉達(dá)發(fā)布新 AI 硬件H200 NVL PCIe GPU 和 GB200 NVL4 超級(jí)芯片
11 月 19日,在 SC24 超算大會(huì)上,英偉達(dá)正式發(fā)布兩款全新 AI 硬件:H200 NVL PCIe GPU 和 GB200 NVL4 超級(jí)芯片。這兩款硬件專(zhuān)為滿(mǎn)足下一代 AI 和高性能計(jì)算(HPC)需求而設(shè)計(jì),分別瞄準(zhǔn)低功耗環(huán)境和單服務(wù)器高性能解決方案。
H200 NVL PCIe GPU 是專(zhuān)為功耗受限環(huán)境設(shè)計(jì)的 AI 計(jì)算卡,采用雙槽厚度設(shè)計(jì),支持風(fēng)冷,最高功耗從 H200 SXM 的 700W 降至 600W。盡管算力有所下降(如 INT8 Tensor Core 算力降低約 15.6%),但 HBM 內(nèi)存容量和帶寬仍與 H200 SXM 持平,分別為 141GB 和 4.8TB/s。
這款 GPU 支持雙路或四路的 NVLink 橋接器互聯(lián),每 GPU 提供高達(dá) 900GB/s 的數(shù)據(jù)傳輸速度。相比上一代 H100 NVL,H200 NVL 在多項(xiàng)指標(biāo)上實(shí)現(xiàn)了顯著提升,其中,內(nèi)存容量增加 1.5 倍;帶寬提升 1.2 倍;AI 推理性能提高 1.7 倍;HPC 應(yīng)用性能提升 30%。英偉達(dá)表示,H200 NVL 的設(shè)計(jì)特別適配現(xiàn)有企業(yè)級(jí)數(shù)據(jù)中心,其中約 70% 的機(jī)架功率不足 20kW,并依賴(lài)空氣冷卻。這款 GPU 為這些環(huán)境提供了更高效的 AI 計(jì)算解決方案。
另一款亮相的硬件是 GB200 NVL4 超級(jí)芯片,該模塊集成了 2 個(gè) Grace CPU 和 4 個(gè) Blackwell GPU,并提供 1.3TB 的 HBM 內(nèi)存池容量,相當(dāng)于兩組 GB200 Grace Blackwell 超級(jí)芯片的組合。其整體功耗達(dá) 5.4kW。
與上代 GH200 NVL4 系統(tǒng)(包含 4 個(gè) Grace CPU 和 4 個(gè) Hopper GPU)相比,GB200 NVL4 在性能上實(shí)現(xiàn)了大幅度提升,模擬性能提高 2.2 倍;AI 訓(xùn)練性能提升 1.8 倍;AI 推理性能增強(qiáng) 1.8 倍。GB200 NVL4 超級(jí)芯片專(zhuān)為單服務(wù)器部署設(shè)計(jì),預(yù)計(jì)將于 2025 年下半年上市,進(jìn)一步滿(mǎn)足 AI 和 HPC 應(yīng)用對(duì)算力密集型硬件的需求。