ニュース

Geminiで音楽生成AIモデル「Lyria 3」が利用可能に

 Googleは2月19日、音楽生成モデル「Lyria 3」をGeminiアプリに統合し、ベータ版として公開した。

 Lyria 3は、プロンプトのほか画像や動画ファイルのマルチモーダル入力から最長30秒の楽曲を生成できる音楽生成AIモデル。インストゥルメンタル、歌モノ問わずさまざまなジャンルを指定可能で、日本語プロンプトにも対応している。プロンプトの代わりに画像や動画を入力した場合は、色調や被写体、動画であれば動きの速さなどを解析し、BPMやテンポ、音の明るさ、音の密度などをマッピングする。また、イメージしている楽曲の雰囲気やテーマを言葉で伝えることで、歌詞も生成する。

 生成した楽曲はMP3形式の音声ファイルもしくは生成AIによるカバーアート付きのMP4動画ファイルとして保存できるほか、共有リンクによる共有が行なえる。生成した音声には人間の可聴域外の電子透かし(SynthID)を埋め込んでおり、生成した音楽かどうかを後から判別可能。Geminiに音声をアップロードすることでSynthIDを確認して検証できる。

 GeminiのLyria 3は18歳以上の全ユーザーを対象として、日本語/英語/ドイツ語/スペイン語/フランス語/ヒンディー語/韓国語/ポルトガル語で提供を始めている。今後は対応言語の拡大と品質の向上を進める予定としている。