9月10日消息,传闻中的128gb显存rtx 5090并不存在。不过,nvidia确实推出了一款配备128gb显存的ai专用gpu。
据悉,NVIDIA下一代GPU架构代号为“Rubin”,预计将于明年正式亮相。
但就在今日,NVIDIA官方发布了“Rubin CPX”——这是一款专为长窗口AI推理和智能体工作负载设计的上下文处理GPU。
该产品基于全新的Rubin架构打造,采用单芯片方案。虽然CUDA核心数量尚未公布,但它配备了四个NVENC编码器和四个NVDEC解码器,以优化视频处理流程,并搭载了高达128GB的GDDR7显存。
根据NVIDIA公布的数据,Rubin CPX在NVFP4精度下峰值算力可达30 PFlops(每秒3亿亿次运算),能够支持百万级token的推理任务。
此外,在处理长上下文场景时,其注意力机制性能相较GB300 NVL72最多提升3倍。
需要指出的是,Rubin CPX目前仅为官方发布阶段,实际产品要到2026年底才会正式上市——没错,正是明年年底。
此前,NVIDIA已透露下一代Rubin GPU与Vera CPU已在台积电成功完成流片,进展符合预期。

以上就是NVIDIA官宣新GPU Rubin CPX!多达128GB显存、推理性能高达百万token的详细内容,更多请关注php中文网其它相关文章!
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号