
NVIDIA 在 CES 2026 主题演讲发布 Vera Rubin 平台,称次世代芯片已进入 "全面投产"
1 月 5 日,NVIDIA 首席执行官黄仁勋在拉斯维加斯方丹白露酒店的 CES 2026 主题演讲中,发布了 Blackwell 的继任者 — 由六颗芯片组成、采用极致协同设计的 AI 计算平台 Vera Rubin。Reuters、The Verge、Yahoo Finance 与 NVIDIA 官方 CES 博客均有报道。黄仁勋表示新一代芯片已进入全面投产阶段,并将 Rubin 定位为 2026 下半年至 2027 年间扩展数据中心容量的核心平台。
Rubin 处在 NVIDIA 的年度更新节奏之中。Blackwell B200 与 B300 在 2024 至 2025 年逐步放量,Rubin 自 GTC 2024 起进入公开路线图,但在商业层面的细节是在本次 CES 2026 才首次披露。该平台由新一代 Vera CPU(用以替换 Grace 的 88 核 ARM 设计)、Rubin GPU、NVLink 6 与 HBM4 内存共同组成。The Verge、Tom's Hardware 与 SiliconAngle 等多家媒体均将本世代的核心主题归纳为 "智能体 AI":黄仁勋将 Rubin 定位为以长上下文、多步推理负载为中心,而不是 Blackwell 当年优化的对话式吞吐场景。
在被业界广泛引用的舞台环节中,黄仁勋将 NVIDIA 的汽车合作和搭载于 Mercedes-Benz CLA 的新推理模型 Alpamayo 形容为 "ChatGPT moment for physical AI."(物理 AI 的 ChatGPT 时刻)。Reuters 另引述他表示 Rubin 已处于 "full production."(全面投产)阶段。NVIDIA 在随后 3 月 16 日 GTC 新闻稿中也使用了相似措辞:"the agentic AI inflection point has arrived with Vera Rubin kicking off the greatest infrastructure buildout in history."(Vera Rubin 拉开了智能体 AI 的拐点,也开启了历史上最大规模的基础设施建设。)
从架构上看,Rubin GPU 据报道集成 3,360 亿晶体管,相较 Blackwell 约 2,080 亿大幅提升;搭载 288 GB HBM4 内存,峰值带宽超过每 GPU 每秒 20 TB(Blackwell 为 HBM3e)。NVLink 6 把每 GPU 互联带宽翻倍至每秒 3.6 TB。Vera Rubin NVL72 机架封装 72 颗 Rubin GPU 与 36 颗 Vera CPU,号称在大规模 Mixture-of-Experts 模型训练上仅需 Blackwell 四分之一的 GPU 数量,每瓦特推理吞吐最高可提升 10 倍。NVIDIA 确认 Blackwell 与 Rubin 合计至 2027 年的累计订单约为 1 万亿美元,首批量产出货预计在 2026 下半年。

行业反应基本沿用既有格局。超大规模云厂商(AWS、Google Cloud、Microsoft Azure、Oracle)与 NVIDIA Cloud Partner 阵营均确认将在 2026 下半年起提供 Rubin 实例。AMD 与 Intel 的回应将在各自主题演讲中给出,最接近的对手 AMD MI400 系列与 Rubin 间仍存在大约一代的差距。Bloomberg 与 Reuters 分析师指出的最大供给侧担忧是 HBM4 — Samsung、SK Hynix 与 Micron 均在加速量产认证,HBM 配额本已是 AI 资本开支的瓶颈。第二个担忧是这一万亿美元订单是否反映可持续需求,还是部分透支了未来的资本开支。
在我们看来,NVIDIA 的路线图对远方世界更主要的意义不是直接采购决策,而是下游的成本信号。我们的成本结构以对话角色、语音智能体与 persona 主导的游戏玩法的推理为主,而非训练。Rubin "每瓦特推理吞吐 10 倍" 的标题对我们的影响,要看它有多少最终通过 Anthropic、Google、OpenAI 的 API 单价以及我们和其它独立工作室实际租用的中端云 GPU 实例传导到下游。2026 年内我们并不预期 API 单价会出现明显阶梯式下行,更可能的路径是单价大致持平或小幅上涨,但上下文窗口逐步扩张。
接下来 12 个月,我们会持续关注三件事:(1) 2026 下半年 Rubin 的出货节奏能否扛住 HBM4 供给约束,还是会滑入 2027 — 那将再次推紧 AI 算力市场。(2) Rubin 的效率红利中,有多少真正传导到面向消费类工作室的 API 单价下行,又有多少被前沿实验室更大规模训练任务消耗掉。(3) 万亿美元的累计订单能否以真实采购订单而非意向书维持 — Reuters 与 Bloomberg 分析师均把这一点列为观察项,一旦松动,整个 AI 基础设施层的情绪都会受影响。


