ニュース

Stability AI、リアルタイムで文字からAI画像を生成する「SDXL Turbo」

SDXL Turboによるリアルタイムでの画像生成

 Stability AIは、リアルタイムでテキストから画像を生成するAIモデル「SDXL Turbo」を発表した。現時点では非商用研究ライセンスでのリリースとなっており、Clipdropを通じてベータ版も公開している。

 SDXL Turboは、SDXL 1.0をベースに、新たに敵対的拡散蒸留(Adversarial Diffusion Distillation、ADD)と呼ばれる技術を採用。シングルステップの画像出力などといったGAN(Generative Adversarial Networks)に共通する多くの利点を得るとともに、アーティファクトやぼやけを抑えられるという。推論速度も大幅に向上した。

 また、プロンプトの出力に近いかどうか、画質がよいかどうかについて、複数の異なるモデルとブラインドテストで比較したところ、SDXL TurboはLCM-XLの4ステップ構成に対して1ステップで、SDXLの50ステップ構成に対して4ステップで、上回る結果を得られたという。