ニュース
Google、Gemini 2.5 Proが複数の仮説を検討可能に。AI音声の話し方も指定可能に
2025年5月23日 13:19
Googleは21日(米国時間)、AIモデル「Gemini 2.5 Pro」向けの新機能として、応答前に複数の仮説を検討する「Deep Think」を発表した。
Deep Thinkは、ユーザーのプロンプトへ応答する前に複数の仮説を検討する実験的な推論モード。Googleは「これまでで最も高性能なモデル」としており、社内実施テストにおいてUSAMO2025(米国数学オリンピック)、LiveCodeBench v6、MMMU(マルチモーダル推論テスト)の各ベンチマークで現行のGemini 2.5 ProやChatGPT o3/o4-miniよりも高い結果が出たという。
そのほかの詳細については明らかにしていないが、現在は安全性評価テスト中であり、今後は一般提供を開始する前の段階で、Gemini APIを通してフィードバックを募る予定だとしている。
Gemini 2.5 Pro/Flash共通の新機能としてはこのほか、音声出力時における指示内容の拡張、API経由でのツール利用サポート、セキュリティの強化を施している。
AIが音声で応答する際の話し方やアクセント、スタイルについて新たにプロンプトで指示できるようになった。AIと音声で対話する際にはさらに、ユーザーの声色から感情を認識する「Affective Dialogue」と、バックグラウンド雑音を無視してスムーズに対話する「Proactive Audio」など初期段階の機能が試せる。またセキュリティ面では、プロンプトインジェクションに対する保護を強化した。