ニュース

実験版Geminig 2.0 Flashで画像生成が可能に。テキストレンダリングも得意

 Google AI Studioにおいて、実験版Gemini 2.0 Flash(gemini-2.0-flash-exp)およびGemini APIを通して画像生成の機能を提供開始した。

 Gemini 2.0 Flashはマルチモーダル入力や強化された推論、自然言語理解を組み合わせて画像を生成する。

 このため、キャラクターと設定を一貫して維持しながら描画を変えたり、目的の画像が得られるようになるまで自然言語で何度もやり取りして編集したり、世界知識と強化された推論により適切な画像を生成したり、ほかの画像生成モデルでは苦手な長いテキストシーケンスの正確なレンダリング能力を持つとしている。