ニュース

Google、映画のような動画を生成できるAI「Veo」。文字が崩れない画像生成AIも

Veoで生成された動画の1フレーム(プロンプト:サバンナの上を歩く複雑な模様のかぎ針編みの象)

 Googleは14日(米国時間)、動画生成AI「Veo」および画像生成AI「Imagen 3」を同社ブログにて発表した。いずれもウェイトリストに登録すると使えるようになった時点で、VeoはVideoFX、Imagen 3はImageFXにおいて利用できる。

 Veoは、テキストや画像のプロンプトから1分以上の1080p動画を生成できる動画生成AIモデル。同モデルは、タイムラプスや空撮といった映画製作で用いられる表現を理解しているほか、シーン全体で被写体やスタイルなどの一貫性を維持した動画を生成できるという。

 Veoで生成された動画には、AI生成コンテンツであることが識別できるよう「SynthID」による透かしが入れられる。Veoは、YouTubeショートやそのほかの製品への導入も予定されている。

プロンプト:岩だらけの崖の上にそびえ立つ灯台の空撮、その灯台が早朝の夜明けを切り裂き、波が下の岩に打ち寄せる様子
プロンプト:中央ヨーロッパの路地のムーディなショット、ノワール映画のような白黒のハイコントラスト、高ディテール

 Imagen 3は、テキストプロンプトから画像を生成できる画像生成AIモデル。最高品質の写実的な画像を生成できると謳っているほか、従来の画像生成AIで課題となっていた、画像内のテキストレンダリングを高精度に行なえるという。

 Imagen 3は今後、Vertex AIにも導入される。

Imagen 3で生成された画像
プロンプト:石に「Central Library」の文字が刻まれた重厚な図書館入口の写真
プロンプト:草の茂った丘の上で夕日を見つめる少年と父親の漫画の1コマ。吹き出しが少年の口から出て、「The sun will rise again」と言いました。 1990年代後半の落ち着いたカラーリングスタイル