ニュース

「Gemini 3 Flash」提供開始。2.5 Proより速く賢い新モデル

 Googleは、高速かつ低コストな新LLM(大規模言語モデル)「Gemini 3 Flash」を発表し、開発者向けに提供開始した。

 Gemini 3 Flashは、上位モデルである「Gemini 3 Pro」のマルチモーダル機能やコーディング機能、エージェント機能を受け継ぎつつ、コストを4分の1未満に抑えたとするモデル。ベンチマークテストにおいて、前世代の上位モデル「Gemini 2.5 Pro」を上回る性能を、約3倍の処理速度で実現したという。

ベンチマーク結果
100万トークンあたりのコスト(横軸)とLLM比較サイトLMArenaでのレーティング(縦軸)によるプロット

 Gemini 3 Flashの紹介文中では、3 Pro(Low)を上回るというエージェントコーディング能力を謳っている。マルチモーダル機能、速度と精度を両立した文章解析能力などにも優れ、活用例として、ゲーム制作エンジンのAstrocadeやLatitudeでのコーディング、生成AIサービスResemble AIにおけるディープフェイク検出、法務向けAIサービスを提供するHarveyでの文書解析などが挙げられている。

Gemini 3 Flash vs 3 Pro Marathon Dashboard

 Gemini 3 Flashは、Google AI Studio、Gemini API、Google Antigravity、Gemini CLI、Android Studio、Vertex AIなどを経由して開発者向けに提供される。Gemini APIおよびVertex AIでの価格は、入力100万トークンあたり0.5ドル、出力100万トークンにつき3ドル。また、コンテキストキャッシュを標準装備しており、一定以上トークンを繰り返し利用すれば、コストを90%削減可能だとしている。