ニュース

Claude Opus 4.6匹敵、100万トークン対応「DeepSeek-V4」無償公開

宇都宮充

2026年4月24日 14:59

DeepSeek-V4-Pro(Max推論モード)と他モデルとの比較

　DeepSeek-AIは4月24日、100万トークンのコンテキスト長に対応したオープンソースAIモデル「DeepSeek-V4 Preview」を公開した。上位モデル「DeepSeek-V4-Pro」の最大推論モードはコーディングベンチマーク「LiveCodeBench」でPass@1 93.5%を記録し、Claude Opus 4.6(88.8%)を上回ったほか、ソフトウェア開発タスク「SWE Verified」でも80.6%とClaude Opus 4.6(80.8%)にほぼ並ぶなど、主要ベンチマークの多くでClaude Opus 4.6に匹敵する性能を示した。モデルの重みはMITライセンスのもとHugging Faceで無償公開されている。

　ラインナップは2種類。上位モデル「DeepSeek-V4-Pro」は総パラメータ数1兆6,000億(推論時アクティブ490億)、下位モデル「DeepSeek-V4-Flash」は総パラメータ数2,840億(同130億)。いずれもMixture-of-Experts(MoE)アーキテクチャを採用する。

　コンテキスト効率の向上を支える中核技術が、独自のハイブリッドアテンション機構だ。KVキャッシュを圧縮してスパースアテンションを行なう「CSA」(Compressed Sparse Attention)と、より強力な圧縮を施す「HCA」(Heavily Compressed Attention)を組み合わせた。100万トークンのコンテキスト設定において、前世代のDeepSeek-V3.2と比べて推論演算量(FLOPs)を約73%、KVキャッシュサイズを約90%削減している。この効率化により、すべてのDeepSeek公式サービスにおいてデフォルトで100万トークンのコンテキスト長を提供できるようにした。

　そのほかのベンチマークでも、DeepSeek-V4-Pro-Maxの性能は際立つ。コーディング競技ベンチマーク「Codeforces」ではレーティング3,206を記録してGPT-5.4(3,168)を上回り、人間の競技参加者の中で23位に相当する。数学ではHMMT 2026 Febで95.2%を記録し、知識評価のSimpleQA Verifiedでも既存のオープンソースモデルを約20ポイント引き離す57.9%を達成している。

　エージェント機能の最適化も施しており、Claude CodeやOpenClaw、OpenCodeといった主要AIエージェントフレームワークとの統合に対応する。ソフトウェア開発タスクのベンチマーク「SWE Verified」では80.6%を達成し、Claude Opus 4.6(80.8%)とほぼ同等の水準だ。

DeepSeek-V4-Flashと他モデルとの比較

　一方のDeepSeek-V4-Flashは、推論時のアクティブパラメータが130億と軽量ながらV4-Proに近い推論能力を持つ。CodeforcesでもGemini 3.1 Pro(3,052)と同等のレーティングを達成するなど、シンプルなタスクではV4-Proに匹敵する。少ないアクティブパラメータ数で素早く応答でき、コストパフォーマンスに優れたAPI価格設定も特徴だ。

🚀 DeepSeek-V4 Preview is officially live & open-sourced! Welcome to the era of cost-effective 1M context length.

🔹 DeepSeek-V4-Pro: 1.6T total / 49B active params. Performance rivaling the world's top closed-source models.
🔹 DeepSeek-V4-Flash: 284B total / 13B active params.…pic.twitter.com/n1AgwMIymu
— DeepSeek (@deepseek_ai)April 24, 2026

「DeepSeek」関連書籍 Amazonで購入