NVIDIA 在 CES 2026 主题演讲发布 Vera Rubin 平台，称次世代芯片已进入 "全面投产"

1 月 5 日，NVIDIA 首席执行官黄仁勋在拉斯维加斯方丹白露酒店的 CES 2026 主题演讲中，发布了 Blackwell 的继任者 — 由六颗芯片组成、采用极致协同设计的 AI 计算平台 Vera Rubin。Reuters、The Verge、Yahoo Finance 与 NVIDIA 官方 CES 博客均有报道。黄仁勋表示新一代芯片已进入全面投产阶段，并将 Rubin 定位为 2026 下半年至 2027 年间扩展数据中心容量的核心平台。

Rubin 处在 NVIDIA 的年度更新节奏之中。Blackwell B200 与 B300 在 2024 至 2025 年逐步放量，Rubin 自 GTC 2024 起进入公开路线图，但在商业层面的细节是在本次 CES 2026 才首次披露。该平台由新一代 Vera CPU（用以替换 Grace 的 88 核 ARM 设计）、Rubin GPU、NVLink 6 与 HBM4 内存共同组成。The Verge、Tom's Hardware 与 SiliconAngle 等多家媒体均将本世代的核心主题归纳为 "智能体 AI"：黄仁勋将 Rubin 定位为以长上下文、多步推理负载为中心，而不是 Blackwell 当年优化的对话式吞吐场景。

在被业界广泛引用的舞台环节中，黄仁勋将 NVIDIA 的汽车合作和搭载于 Mercedes-Benz CLA 的新推理模型 Alpamayo 形容为 "ChatGPT moment for physical AI."（物理 AI 的 ChatGPT 时刻）。Reuters 另引述他表示 Rubin 已处于 "full production."（全面投产）阶段。NVIDIA 在随后 3 月 16 日 GTC 新闻稿中也使用了相似措辞："the agentic AI inflection point has arrived with Vera Rubin kicking off the greatest infrastructure buildout in history."（Vera Rubin 拉开了智能体 AI 的拐点，也开启了历史上最大规模的基础设施建设。）

从架构上看，Rubin GPU 据报道集成 3,360 亿晶体管，相较 Blackwell 约 2,080 亿大幅提升；搭载 288 GB HBM4 内存，峰值带宽超过每 GPU 每秒 20 TB（Blackwell 为 HBM3e）。NVLink 6 把每 GPU 互联带宽翻倍至每秒 3.6 TB。Vera Rubin NVL72 机架封装 72 颗 Rubin GPU 与 36 颗 Vera CPU，号称在大规模 Mixture-of-Experts 模型训练上仅需 Blackwell 四分之一的 GPU 数量，每瓦特推理吞吐最高可提升 10 倍。NVIDIA 确认 Blackwell 与 Rubin 合计至 2027 年的累计订单约为 1 万亿美元，首批量产出货预计在 2026 下半年。

NVIDIA 创始人兼首席执行官黄仁勋 — 2025 年的黄仁勋。来源：白宫官方照片／Wikimedia Commons（公有领域）。

行业反应基本沿用既有格局。超大规模云厂商（AWS、Google Cloud、Microsoft Azure、Oracle）与 NVIDIA Cloud Partner 阵营均确认将在 2026 下半年起提供 Rubin 实例。AMD 与 Intel 的回应将在各自主题演讲中给出，最接近的对手 AMD MI400 系列与 Rubin 间仍存在大约一代的差距。Bloomberg 与 Reuters 分析师指出的最大供给侧担忧是 HBM4 — Samsung、SK Hynix 与 Micron 均在加速量产认证，HBM 配额本已是 AI 资本开支的瓶颈。第二个担忧是这一万亿美元订单是否反映可持续需求，还是部分透支了未来的资本开支。

在我们看来，NVIDIA 的路线图对远方世界更主要的意义不是直接采购决策，而是下游的成本信号。我们的成本结构以对话角色、语音智能体与 persona 主导的游戏玩法的推理为主，而非训练。Rubin "每瓦特推理吞吐 10 倍" 的标题对我们的影响，要看它有多少最终通过 Anthropic、Google、OpenAI 的 API 单价以及我们和其它独立工作室实际租用的中端云 GPU 实例传导到下游。2026 年内我们并不预期 API 单价会出现明显阶梯式下行，更可能的路径是单价大致持平或小幅上涨，但上下文窗口逐步扩张。

接下来 12 个月，我们会持续关注三件事：(1) 2026 下半年 Rubin 的出货节奏能否扛住 HBM4 供给约束，还是会滑入 2027 — 那将再次推紧 AI 算力市场。(2) Rubin 的效率红利中，有多少真正传导到面向消费类工作室的 API 单价下行，又有多少被前沿实验室更大规模训练任务消耗掉。(3) 万亿美元的累计订单能否以真实采购订单而非意向书维持 — Reuters 与 Bloomberg 分析师均把这一点列为观察项，一旦松动，整个 AI 基础设施层的情绪都会受影响。

Share

NVIDIA 在 CES 2026 主题演讲发布 Vera Rubin 平台，称次世代芯片已进入 "全面投产"

Related Articles

远方世界开放 ORDO 内测预约，并上线产品网站

五角大楼向 7 家 AI 供应商授予机密网络合同，Anthropic 因使用条款分歧被排除

DeepSeek 发布 V4：1.6 万亿参数、1M token 上下文，延续 MIT 协议开源