ニュース

テキストから音楽をAIが生成するサービス「Stable Audio」。45秒なら無料

 Stability AIは、生成AIによってテキストから音楽/サウンドを生成する「Stable Audio」を発表した。無償で45秒のトラックが生成できるサービスに加え、商用利用可能で90秒のトラックを生成する「Pro」サブスクリプションも用意。

 説明的なテキストのプロンプトを入力すると、希望するオーディオの長さに合わせて音楽が自動で生成される。基礎モデルは、主要音楽ライブラリであるAudioSparxの音楽とメタデータを使用してトレーニングされた。両者のパートナーシップにより、すべての関係者に経済的価値と創造的価値の両方がもたらされるという。

 技術的にはlatent diffusionモデルを使用している。Stable Audioは商用利用できる高品質な44.1kHzの音楽を生成できる初の音楽生成AIの製品となった。

latent diffusionモデル