IT之家 9 月 10 日消息,英偉達美國當地時間 9 日發布了麵向大規模上下文推理處理和視頻生成 AI 應用的 Rubin CPX GPU。該 GPU 基於"Rubin" 架構構建但與此前已公布的 Rubin Tensor Core GPU 又有不少區別之處。
Rubin CPX GPU 采用經濟高效的單片式設計,注重 NVFP4 數據格式計算資源,同時搭載了 NVENC / NVDNC 視頻編解碼單元,配備 128GB 的 GDDR7 顯存。
根據英偉達官方提供的 Rubin CPX 渲染圖,該 GPU 包含 4×4×3×4=192 組的重複單元(IT之家注:參見下圖黃色方框),應該對應著 192 組 SM,這一數量與 GB202 相當。
而在機架係統層麵,從 Vera Rubin NVL144 到 Vera Rubin NVL144 CPX,係統增加了 144 塊 Rubin CPX GPU,NVFP4 算力提升了 4.4 EFLOPS、顯存帶寬提升了 0.3PB/s、快速存儲增長了 25TB。
從顯存帶寬角度,每顆 Rubin CPX GPU 大致對應約 2083GB/s 顯存帶寬。考慮到 512-bit 顯存位寬的 GeForce RTX 5090 擁有 1792GB/s 的顯存帶寬、Rubin CPX GPU 的顯存容量為 128GB,Rubin CPX GPU 應同樣具備 512-bit 的顯存位寬,顯存等效速率估算數值約為 32.55Gbps。
關於国产AV蜜桃网站|版權聲明| 違法和不良信息舉報電話:010-84151598 | 網絡敲詐和有償刪帖舉報電話:010-84151598
Copyright © 2008-2024 by {當前域名}. all rights reserved