ニュース

推論性能が大幅に向上した「DeepSeek-V3-0324」

 DeepSeekは25日、推論性能の大幅向上や、フロントエンド開発スキルの向上、よりスマートになったツール使用能力などを備えた「DeepSeek-V3-0324」を発表した。

 同社が公開したベンチマークデータによれば、「MMLU-Pro」および「GPQA Diamond」ではGPT-4.5よりやや劣るがClaude-Sonnet-3.7に比肩、「MATH-500」、「AIME 2024」、「LiveCodeBench」で競合を上回る性能を実現したという。

 なお、複雑ではないタスクの場合は「DeepThink」をオフにし、V3の使用を推奨している。APIの使用に変更はない。モデルはDeepSeek-R1と同様にMITライセンスとなっており、重みデータについてはオープンソースで公開している。