英偉達 Blackwell 處理器被曝存在過熱 項目或延期
近日,據報道,英偉達備受矚目的新一代 Blackwell GPU 在高密度服務器機架中出現嚴重的過熱問題。該問題引發了設計調整與項目延期,使谷歌、Meta、微軟等主要客戶對能否按計劃部署 Blackwell GPU 感到擔憂。這些 GPU 專為 AI 和高性能計算(HPC)設計,但在單個服務器機架配置 72 個處理器的情況下,功耗可高達 120 千瓦,隨之而來的散熱挑戰也日益突出。
知情人士透露,英偉達 Blackwell 處理器的過熱問題迫使公司多次修改機架設計,為應對高功耗和散熱壓力,不得不限制部分 GPU 性能,以降低硬件損壞風險。這一技術難題影響了客戶對產品的部署計劃,包括谷歌、Meta 和微軟等科技巨頭,他們高度依賴英偉達 GPU 訓練其最強大的 AI 模型。項目延期可能會對這些客戶的研發進程與產品發布節奏帶來不小的影響。
面對過熱挑戰,英偉達已要求供應商調整機架設計,優化散熱系統。據悉,英偉達與云服務提供商密切合作,通過工程調整希望緩解散熱瓶頸,確保產品性能和可靠性。英偉達發言人在接受路透社采訪時稱,這些設計改進屬正常研發流程的一部分,公司正在加緊應對技術挑戰,以便按預期滿足客戶需求。
據報道,修訂后的 Blackwell GPU 于今年 10 月底才進入量產,預計最快將于明年 1 月底出貨。盡管英偉達曾在今年 3 月展示 Blackwell 芯片,并計劃在第二季度發貨,但實際發貨時間顯然已被推遲。對于谷歌、Meta、微軟等依賴 Blackwell GPU 的科技巨頭來說,這一延期無疑對其 AI 研發和高性能計算部署計劃產生了不可忽視的影響。