
NVIDIA、CES 2026 基調講演で Vera Rubin プラットフォームを発表 — 次世代チップは "本格生産" 段階に
1 月 5 日、NVIDIA の最高経営責任者ジェンスン・フアン氏はラスベガスのフォンテーヌブロー・ホテルで行われた CES 2026 の基調講演で、Blackwell の後継となる 6 チップ構成・エクストリームコ ーデザインの AI 計算プラットフォーム Vera Rubin を発表した。Reuters、The Verge、Yahoo Finance、および NVIDIA 公式 CES ブログがこれを報じている。フアン氏は次世代チップが本格生産段階にあると述べ、Rubin を 2026 年下半期から 2027 年にかけてデータセンター容量を拡大する基盤と位置付けた。
Rubin は NVIDIA の年次更新サイクルの中に位置する。Blackwell B200 / B300 は 2024 年から 2025 年にかけて立ち上がり、Rubin 自体は GTC 2024 のロードマップから公表されていたが、商用レベルの詳細が示されたのは今回の CES 2026 である。プラットフォームは新 Vera CPU(Grace を置き換える 88 コアの ARM 設計)、Rubin GPU、NVLink 6、HBM4 メモリで構成される。The Verge、Tom's Hardware、SiliconAngle はいずれも、本世代の中心テーマがエージェント AI であると整理しており、フアン氏は Rubin を、Blackwell が最適化されてきたチャット型スループットではなく、長文脈・多段推論ワークロードを軸に設計したと位置付けた。
業界紙が広く引用したステージ上の場面では、フアン氏が NVIDIA の自動車パートナーシップと、Mercedes-Benz CLA に搭載される新しい推論モデル Alpamayo を、"ChatGPT moment for physical AI." と表現した。Reuters は別途、Rubin が "full production." 段階にあるという同氏の発言を引用している。NVIDIA は 3 月 16 日の GTC リリースでも同じ枠組みで、"the agentic AI inflection point has arrived with Vera Rubin kicking off the greatest infrastructure buildout in history."(Vera Rubin によりエージェント AI の変曲点が到来し、史上最大のインフラ構築が開始された)と表明している。
アーキテクチャ面では、Rubin GPU はトランジスタ数 3,360 億個(Blackwell の約 2,080 億個から増加)、288 GB の HBM4 メモリを搭載し、ピーク帯域幅は GPU あたり毎秒 20 TB を超えるとされる。Blackwell の HBM3e からの世代交代である。NVLink 6 は GPU あたりの相互接続帯域を毎秒 3.6 TB に倍増する。Vera Rubin NVL72 ラックは 72 基の Rubin GPU と 36 基の Vera CPU をパッケージし、大規模 Mixture-of-Experts モデルを Blackwell 比 4 分の 1 の GPU 台数で学習でき、推論スループットあたりの電力効率も最大 10 倍になると主張されている。NVIDIA は 2027 年までの Blackwell + Rubin 合計受注がおよそ 1 兆ドルに達したことを確認しており、量産出荷の最初のロットは 2026 年下半期を予定する。

業界反応はおおむね既存の構図に沿った。ハイパースケーラー(AWS、Google Cloud、Microsoft Azure、Oracle)と NVIDIA Cloud Partner 各社は、Rubin ベースのインスタンスを 2026 年下半期から提供開始すると確認した。AMD と Intel の応答はそれぞれの基調講演で示される見込みで、競合に最も近いのは AMD の MI400 ファミリーだが、世代差はおおよそ 1 世代分残ると見られている。供給面で Bloomberg と Reuters のアナリストが最大の懸念として指摘しているのは HBM4 で、Samsung、SK Hynix、Micron いずれも量産認定を急いでいるが、HBM 配分はすでに AI 設備投資のボトルネックである。第二の懸念は、1 兆ドル規模の受注が持続可能な需要を反映しているのか、将来の設備投資の前倒しに過ぎないのか、という点だ。
遠方世界としては、NVIDIA のロードマップは直接の調達判断というより、下流に効くコスト信号として重要である。当社のコスト構造は学習ではなく、対話キャラクター、音声エージェント、ペルソナ主導のゲームプレイの推論に偏っている。Rubin の "ワットあたり推論スループット 10 倍" という見出しが我々に届くのは、Anthropic、Google、OpenAI の対トークン API 単価、および我々や独立系スタジオが実際に借りる中位帯クラウド GPU インスタンスを通じて、価格が下がる経路を辿った場合である。2026 年中の API 価格の段階的下落は当社では織り込んでいない。より可能性が高いのは、対トークン単価がほぼ横ばいまたはわずかに上昇しつつ、コンテキスト長が段階的に拡大していく経路である。
今後 12 か月、我々は次の三点を注視する。(1) 2026 年下半期の Rubin 出荷ペースが、HBM4 の供給制約に押されて 2027 年に後ろ倒しとならないか — その場合 AI 計算リソース市場が再びタイト化する。(2) Rubin の効率向上のうち、コンシューマ向けスタジオが実際に目にする対トークン API 単価の引き下げに転化される割合 — その大半がフロンティアラボのさらに大きな学習ジョブに吸収される可能性もある。(3) 1 兆ドルの受注残が、意向書ではなく実際の購入注文として維持されるか — Reuters と Bloomberg のアナリストはここを注目点として挙げており、ここがソフト化すれば AI インフラ全層のセンチメントが動く。


