ニュース

Google、Gemini 2.5公開。推論やコーディング性能が向上

 Googleは25日、最新のAIモデルとなる「Gemini 2.5」を発表した。上位モデルの試験版となるGemini 2.5 Pro Experimentalは、すでにGoogle AI Studioで利用でき、Gemini Advancedユーザーもデスクトップおよびモバイル版で選択可能となっている。

 Gemini 2.5は、回答する前に思考して推論し、複雑な問題に対処するために設計されたAIモデル。大幅なベースモデルの強化と事後トレーニングの改善により、パフォーマンスを引き上げた。これらの思考能力を同社のすべてのモデルに組み込んでいくという。

Gemini 2.5 Proのベンチマーク結果

 最上位モデルとなるGemini 2.5 Pro Experimentalは、リリース時点で100万トークン(近日中には200万トークン)のコンテキストウィンドウを持ち、テキスト、音声、画像、動画、コードリポジトリ全体など、膨大なデータセットを理解し、複雑な問題を処理できる。

 GPQAやAIME 2025といった数学/科学のベンチマークで、GPT-4.5やDeepSeek R1などを上回る結果を達成したほか、Humanity's Last Examにおいても18.8%のスコアを獲得。また、コーディング性能も大幅に向上しており、SWE-Bench Verifiedでは63.8%のスコアを記録したとする。

 同社ではあわせて、1行のプロンプトからGemini Pro 2.5が実行可能なコードを生成し、ビデオゲームを作成するデモも公開している。

Gemini 2.5: Create your own dinosaur game from a single line prompt