Nvdia Rubin CPX上线推迟,基底订单未能实现网页链接
去年9月,英伟达推出了Rubin CPX的设计蓝图,预期会在2026年底上线。
但是在今年3月的GTC中,Rubin CPX 加速器完全没有出现在任何幻灯片或议程中,引发市场对其取消的猜测。NVIDIA 副总裁 Ian Buck 随后向 ComputerBase 确认 Rubin CPX 已被"延后",并定位到 Feynman 世代(预计 2028 年推出)。
CPX 经济性的本质——它本来就是 GDDR/HBM 价差套利产物,用便宜大容量内存承担 compute-bound 但带宽要求没那么极致的 prefill 工作。当 GDDR7 绝对价格被卷进 DRAM 涨价周期(消费级 DRAM Q1 涨 75-80%,Q2 再 45-50%),这个卖点确实受损。
NVIDIA 官方给的取消原因:是工作负载结构变了Ian Buck 原话:CPX 只改善 TTFT,不改善实际 token 速度,而 prefill 在整体工作负载里占比并不大。在 agent-to-agent、400-500K KV context、1000 tokens/sec 的新场景下,瓶颈从 prefill 延迟转移到 decode 吞吐。