
DeepSeek、V4 をリリース — 総パラメータ 1.6 兆・コンテキスト 100 万トークン、MIT ライセンスでウェイト公開
4 月 24 日、中国の研究機関 DeepSeek は V4 モデルシリーズを公開し、フラッグシップ V4-Pro を総パラメータ 1.6 兆・アクティブパラメータ 490 億、コンテキストウィンドウ 100 万トークン、MIT ライセンス下のオープンウェイトとして配布した。情報ソースは DeepSeek API リリースノート、Hugging Face モデルカード、および Reuters の報道である。第二バリアントの V4-Flash は総パラメータ 2,840 億・アクティブ 130 億。本リリースは現時点で最も能力の高い中国系オープンウェイトモデルとなり、Qwen 3.6 と Llama 4 に対するオープンソース・フロンティアの位置を塗り替えた。
DeepSeek は、ヘッジファンド High-Flyer Quant と同一グループの梁文鋒(Liang Wenfeng)氏が立ち上げた研究機関で、2025 年初頭の V3 系列および推論モデル R1 以降、おおむね半年ペースで主要モデルを更新してきた。同ラボは R1 を含めウェイトを一貫してオープンに公開しており、V4 のリリースは、米国による中国フロンティア能力の抑え込み圧力下でもこの方針が維持されたことを意味する。アーキテクチャは Mixture-of-Experts コアと、ハイブリッド注意機構 — DeepSeek が「Compressed Sparse Attention」および「Manifold-Constrained Hyper-Connections」と呼ぶ二系統 — を組み合わせており、Hugging Face モデルカードによれば、同コンテキスト長下で V4-Pro のトークンあたり推論 FLOP は V3.2 のわずか 27% に抑えられているという。
DeepSeek は V4 リリースに合わせて公の記者会見を開いていない。最も直接的な記述は同社の API リリースノートにあり、そこでは V4 は 100 万トークンの文脈を、検索ではなくワーキングメモリとして使えるエージェントシステムへの一歩として位置づけられている。Forbes の報道によれば、ラボのシニア研究者の一人はオープンウェイトのリンクとともに「Go wild and have fun」とだけ X に投稿した。梁文鋒氏のこれまでの発言は、短期の商用化よりも長期主義と AGI を軸にラボを位置づけるものであり、本稿時点で V4 に直接ひもづく公式コメントは確認されていない。
DeepSeek がモデルカードと併記し、Hugging Face 側でも追認されたベンチマーク値によれば、V4-Pro は MMLU-Pro で 87.5、SWE-bench Verified で 80.6%、GPQA Diamond で 90.1、LiveCodeBench で 93.5、Humanity's Last Exam(HLE)で 37.7 を記録した。Hacker News や Asia Times の整理では、推論およびコーディング系の主要ベンチで V4-Pro は Qwen 3.6 と Llama 4 を上回る一方、HLE と難易度の高い SWE-bench スライスではクローズドな最前線 — Gemini 3.1 Pro や Claude Opus 系 — に依然として劣後する。Reuters はまた、本リリースを契機に中国系ハイパースケーラーの間で Huawei Ascend チップの確保競争が顕在化したと報じている。

反応はおなじみの地政学的断層線に沿って分かれた。Council on Foreign Relations は本リリースを「米中 AI 競争の新たな局面」と評し、米当局が DeepSeek による V4 の訓練に関し密輸された Blackwell シリコンの利用を公に指摘し、米フロンティアモデルに対する産業規模の蒸留行為を糾弾していること、4 月には国務省が同盟国向けに外交ディレクティブを発出したことを確認した。Forbes の Markman 氏は V4 が Qwen シリーズと併せ「オープンソース AI 競争の構図を塗り替える」と論じる一方、Reuters は株式市場の反応が抑制的だった点を捉え、V4 は本年最強級のオープンリリースでありながら「市場を熱狂させていない」モデルだと描写した。
遠方世界としては、V4 の重要性は単一ベンチマーク上の数字よりも、オープンウェイトの「価格下限」を再設定したことに表れる。当社のキャラクターエンジンとペルソナスタックは、生の知能指標よりも推論コスト・遅延・オンデバイス実現性を先に最適化する設計だ。アクティブ 490 億・総 1.6 兆の MoE は、コンシューマ向けにローカルファーストで提供するデスクトップ実装に直接組み込むには依然として大きすぎるが、キャラクターゲームのバックエンドと、B2B 顧客にライセンスする推論クラスタにおいて当社が展開可能な天井を一段引き上げた。本リリースはまた、当社のキャラクター層を単一の基盤モデル — オープン・クローズドを問わず — に固定しないという基本方針を改めて補強するものである。
今後 12 か月、当社は以下の三点を注視する。(1) 米国の輸出管理強化下で DeepSeek が現行の半年リリースケイデンスを維持できるか — 1.6 兆 MoE 訓練には、密輸 Blackwell パイプラインでは安定供給が見込みにくい連続演算量が必要となる。(2) V4-Flash 2,840 億バリアントが、当社の規模のチームが実装する中遅延キャラクターエンジン系プロダクトの実用主力に育つか — フラッグシップのベンチ値と実装現場のギャップを埋めるレイヤとして見ている。(3) オープンソースライセンスの伝播 — 下流の中国系クラウドフォークが MIT を尊重するか、欧米のエンタープライズ調達が MIT ライセンスの中国製ウェイトを実際に展開可能と扱うか。

