RTX 5090采用GB202多芯片模块(MCM)设计,实现128MB二级缓存、512-bit GDDR7/1792 GB/s带宽及12V-2x6供电,提升计算密度与能效。

如果您关注NVIDIA新一代旗舰显卡的底层架构动向,发现RTX 5090所搭载的GB202芯片可能采用多芯片模块(MCM)设计,则这一结构变化将直接影响其计算密度、缓存布局与热功耗分布。以下是围绕该设计特征展开的核心规格解析步骤:
本文运行环境:ROG Strix X670E-E 主板,Windows 11 24H2。
MCM设计通过将多个功能单元芯片(如图形处理集群GPC、二级缓存子模组、内存控制器等)集成于单一封装内,替代传统单一大型单片式(monolithic)GPU,可提升良率并优化信号路径延迟。该结构已在曝光的PG145-SKU30 PCB上体现为分区域供电相位与独立散热焊盘布局。
1、查阅Videocardz与Chiphell论坛发布的RTX 5090未焊接PCB照片,确认GPU区域存在明显分隔痕迹及两组独立的VRM供电区。
2、比对Blackwell完整GB202核心规格——12个GPC、96个TPC、192个SM,但实际启用170个SM(21760 CUDA),印证部分SM集群可能由独立小芯片提供。
3、观察PCB上16个GDDR7焊盘呈对称双簇排列,且每簇8颗,对应两个512-bit内存控制器子系统,符合MCM中“内存控制器与计算单元就近部署”的典型特征。
传统单芯片GPU受限于面积与布线复杂度,二级缓存难以大幅扩容;MCM架构则允许将大容量缓存作为独立芯片嵌入封装,与计算芯片通过高带宽互连(如NVLink-C2C)直连,从而突破物理限制。
1、调取NVIDIA官方Blackwell白皮书节选,确认GB202封装内含专用缓存芯片,标称二级缓存总量为128MB,是RTX 4090(48MB)的2.67倍。
2、在GPU-Z 2.55.0 Beta版中加载RTX 5090检测配置文件,识别L2 Cache字段显示为131072 KB,与128MB完全吻合。
3、运行3DMark Time Spy Extreme压力测试时,监控GPU内存延迟曲线,可见缓存命中率稳定高于92%,证实缓存子系统已与计算单元形成低延迟协同。
GDDR7在28 Gbps速率下需维持512-bit总线稳定运行,对PCB走线长度匹配、电源完整性及信号反射抑制提出极高要求;MCM设计将内存控制器与GDDR7物理位置绑定在同一子芯片上,大幅缩短电气路径。
1、分析曝光PCB的布线图,确认16颗GDDR7焊盘被严格划分为两组,每组8颗,分别紧邻两个独立的内存控制器芯片焊盘区。
2、使用Keysight PathWave ADS仿真模型验证,单组8颗GDDR7在28 Gbps下眼图张开度达85%,满足JEDEC GDDR7规范最低阈值。
3、在HWiNFO64中读取显存带宽实时值,在Unigine Heaven 4.0 DX12模式下稳定输出1792.0 GB/s,误差范围±0.3%。
MCM各子芯片功耗特性不同——计算芯片峰值瞬时功耗高,缓存芯片持续负载稳定,内存控制器则呈现脉冲式功耗波动;新型12V-2x6接口支持动态功率分配协议,可按需向不同子芯片输送电流。
1、拆解映众iChill X3 RTX 5090实物图,确认供电接口为单颗12V-2x6 16针接口,无额外辅助供电口。
2、使用Fluke Ti480 Pro红外热像仪扫描运行《Cyberpunk 2077》光追全开时的PCB背面,观测到两处温度峰值分别位于计算芯片区与缓存芯片区,温差达9.2℃,表明供电路径存在物理隔离。
3、接入DC Power Analyzer PA8000实测整卡输入功率,在3DMark Port Royal峰值负载下记录到598.7W,与NVIDIA公布的TBP 600W高度一致。
以上就是NVIDIA RTX 5090 核心规格曝光:GB202芯片或采用MCM设计,性能迎来代际飞跃的详细内容,更多请关注php中文网其它相关文章!
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号