ニュース

4秒で画像を爆速生成できる「Nano Banana 2 Lite」登場

 Google DeepMindは6月30日(米国時間)、4秒で画像生成可能なAIモデル「Nano Banana 2 Lite(gemini-3.1-flash-lite-image)」を発表した。Google検索のAIモードやGeminiアプリ、Google AI Studio、Gemini APIなど、多数のサービスやプラットフォームで同日より展開されている。

 Nano Banana 2 Liteは、速度とコストを最優先しており、テキストから画像への出力がわずか4秒で完了するほか、1K解像度の画像あたり0.034ドルの低価格が特徴。

 速度を優先しているにもかかわらず、プロンプトへの確実な追従性や高いキャラクターの一貫性、読みやすい画像内テキストレンダリングといった特徴を維持。そのため、インタラクティブなプロトタイピングや迅速なビジュアルドローイングに好適だという。現在Nano Bananaの初期バージョン(gemini-2.5-flash-image)を使用している開発者には置き換えを推奨している。

Nano Banana 2 Liteの性能および速度、価格の比較

 また同時に、Google I/Oで発表された、会話型動画編集モデル「Gemini Omni Flash(gemini-omni-flash-preview)」も、Gemini APIおよびGoogle AI Studioを介して開発者向けに提供開始された。価格は動画出力1秒あたり0.10ドルと、Veo 3.1 Fastと同等の競争力のある価格設定となっている。

Gemini Omni Flashで編集された動画(右上はオリジナル)

 Gemini Omni Flashは自然言語を使って動画編集できるモデルで、画像/テキスト/動画の入力を組み合わせて、シーン制御および一貫性維持を実現。歴史、生物学、物語の論理など、Geminiの知識を活用して動画を生成できる。

Gemini Omni Flashの性能

 現在は10秒間の動画生成が可能だが、近日中にさらに長い動画生成も可能になる。なお、音声参照やシーン拡張機能のアップロードはまだサポートされないほか、APIスキーマでは最大3秒まで動画参照を受け付けるが、現時点では正しく処理されないという。また、シーン切り替え時やパンニング時のキャラクターの一貫性にも多少の制約があり、改善に向けて取り組んでいる。