Mac Info

画像生成AI「Stable Diffusion」を手軽に使ってみよう!

 2022年にStability AIがオープンソースで公開した「Stable Diffusion」は、ディープラーニング(深層学習)によって入力したテキストから画像を自動作成する画像生成AIです。当初Macで利用するには自らセットアップして実行環境を構築する必要がありましたが、現在はStable Diffusionを組み込んだアプリがたくさんリリースされ、誰もが簡単に利用できます。その中でもまず一番に試してみたいのが、Macで動作する「DiffusionBee」というアプリ。ここではDiffusionBeeの基本的な使い方に加えて、目的の画像を上手に生成するための方法についても解説していきます。

DiffusionBeeは、誰でも手軽に画像生成AIの実力を試せるMac用の無料アプリです

画像生成AIを使う前の注意点

 オープンソースとして公開されているStable Diffusionを組み込んだMac用アプリは多数存在します。その中でも、DiffusionBeeはテキストからの画像生成に加え、すでにある画像から新しい画像を生成したり、画像の一部を加工したり、解像度を上げたりできるなど非常に多機能なのが特徴です。

 アプリは無料でダウンロードできるので、ぜひ気軽にインストールしてみましょう。ただし、利用するうえではいくつかの注意点があります。まず、1つはアプリケーションのサイズです。

 DiffusionBeeに限らず、こうした画像生成AIアプリをMacのローカル環境で実行するには画像を生成するための「モデルデータ」をダウンロードする必要があり、そのサイズは数GBを超えることがあります。ストレージに十分な空き容量があるかどうか、インストール前に確認しておきましょう。

 次に注意したいのが、対応するMacです。DiffusionBeeでは現行のApple Silicon向けのバージョンと、Intel製CPUを搭載したMac(Intel Mac)向けのバージョンが公開されていますが、実際に利用するうえではApple Silicon(M1またはM2チップ)を搭載したMacのほうが高速に処理できます。

 Intel Macを使っている場合は画像生成に時間がかかることがありますので、画像生成AIの真の実力を知るうえではできる限り現行のApple Silicon搭載Macで試すほうがいいでしょう。また、画像生成時には大量のメモリを消費するので、実行中はほかのアプリを終了するなどの対策もしておきましょう。

DiffusionBeeは画像生成AIの「Stable Diffusion」をMacで実行できるアプリです。公式サイトから[Download for macOS]をクリックします
Apple Silicon用のバージョンには、通常版と速度が2倍かかるがより高品質な画像を生成できるHQ版があります。Intel Mac用アプリもあるので、マシンに合わせてダウンロードしましょう
ダウンロードしたディスクイメージを開き、[DiffusionBee]を[Applications]にドラッグ&ドロップすればインストール完了です
初回の起動時にはモデルデータの読み込みが開始されます。ファイルサイズが数GBあるのでしばらく待ちます

DiffusionBeeの基本的な使い方

 DiffusionBeeの使い方はとてもシンプルです。インストール終了後にアプリを起動してメイン画面が表示されたら、[Text To Image]タブの入力欄にテキスト(プロンプトと呼ばれます)を英語で入力。そしてあとは[Generate]ボタンをクリックすれば、自動で画像が生成されます。

 しかし、目的の画像を得るのは一筋縄ではいきません。というのも、どんなプロンプトを入力するかによって生成される画像が大きく変わるからです。

 1つや複数の単語を入力するだけではうまくいかず、時には説明文のように複雑な言葉を組み合わせて入力しないと目的の画像が生成されないこともあります。目的の画像を得るには、SNSなどでよく言われるようにプロンプトを上手に組み合わせた「呪文」を生み出す必要があるのです。

 ネットを検索するとさまざまなプロンプトが作例とともに多数紹介されているので、ぜひ参考にしてみましょう。最初から思い通りの画像を出力するのは難しいと思うので、まずはプロンプトをそのままコピーして試してみるのがおすすめです。

 また、DiffusionBeeのメイン画面から[Prompt Ideas]タブをクリックすると「ArtHub.ai」というサイトが表示され、DiffusionBeeを利用して作られたイラストやそのプロンプトを確認でき、プロンプトはコピーして利用できます。

 さらに、メイン画面の[Styles]からプロンプトの種類を参照することも可能です。[Drawing Style](描画スタイル)や[Visual Style](絵のスタイル)、[Pen](ペンの種類)、[Carving and Etching](彫刻とエッチング)、[Camera](カメラ)、[Color](色)といったさまざまなプロンプトが掲載されており、クリックすることで入力できます。

メイン画面の[Text To Image]タブの入力欄にプロンプトを入力します。現状は日本語に対応していないので、英語でテキスト入力して[Generate]ボタンをクリックします
プロンプト入力後、[Generate]ボタンをクリックすると画像が自動生成されます。[Save Image]をクリックすると、生成された画像を保存できます
[Prompt Ideas]タブをクリックすると外部サイトの「ArtHub.ai」が開かれ、投稿されたさまざまな作風のイラストと使用されたプロンプトを確認できます。ただし、同じプロンプトをコピーして利用しても、設定やモデルデータの違いなどが影響するので同じ画像が生成されるわけではありません
[Styles]をクリックするとさまざまなプロンプトの例が表示され、クリックして入力できます
[Image To Image]タブに切り替えると、画像から新たな画像をAIで生成できます。左側に元画像をドラッグ&ドロップで登録し、プロンプトを指定して生成すると右側に表示されます
生成した画像の左上をクリックしてメニューから[Send to Inpaint]を選択すると、画像に別の要素を追加できます。追加したい場所をマウスやトラックパッドで塗りつぶして選択し、プロンプトを追加して[Inpaint]をクリックします

イメージ通りのイラストを作成するには

 DiffusionBeeをもっと上手に使いこなしたいと思ったら、プロンプトについてしっかりと学んでみましょう。そのためにはStable Diffusionを公開したStability AIのサイトに掲載されている「Promt Guide(プロンプトガイド)」が役立ちます。

 そこで説明されている内容をかいつまんで紹介すると、目的の画像を得るためにまず重要となるのは、画像の主題となる「コアプロンプト」とその画風を表わす「スタイル」の指定であること。これらがもっとも画像生成に大きな影響を与えます。

 また、コアプロンプトとスタイルに加えて、実在する画家やイラスト投稿サイトの特徴である「アーティスト」のプロンプトをさらに追加すると、多くの場合で良好な結果が得られる可能性が高まります。

 さらに、背景や光の当たり方などの条件を細かく追加していくことも可能ですが、プロンプトが長文になるほど予想しなかった影響が出力されることがあります。その場合は、そのまま画像を再生成するか、要素の重み付けを減らすプロンプトを追加してから画像を生成するなど試行錯誤を繰り返すようにしましょう。

 なお、画像生成のオプション項目にある数値を変更することで、出力される画像の傾向や精細度が変わってくることも説明されています。もちろん、これらのテクニックを使えば必ずイメージに近い画像が生成されるというわけではありませんが、AIのプロンプトの解釈が安定し、目的の画像に近い画像が生成する可能性が高まるでしょう。

Stable Diffusionを公開したStability AIのサイト「dreamstudio.ai」ではPromt Guideが公開されています。ここからは、このガイドに沿ってプロンプトと出力結果の対応を順番に説明していきましょう。まずは「コアプロンプト」の例として「cat」と入力して画像を生成してみたのがこの図です
次に「スタイル」のプロンプトとして「Realistic」(現実的な)、「Oil painting」(油絵)、「Pencil drawing」(鉛筆画)などを指定します。「An oil painting of a cat」と入力してみると、よりイメージに近い画像が出力されました
画風を具体的に指定するために「アーティスト」のプロンプトを追加します。肖像画の「Paul Cézanne」(ポール・セザンヌ)、油絵の「Vincent Van Gogh」(フィンセント・ファン・ゴッホ)、風景画の「Claude Monet」(クロード・モネ)などを指定します。ここでは「An oil painting of a panda by Leonardo da Vinci and Frederic Edwin Church」と複数の画風を指定しました
仕上げのプロンプトとして「Highly detailed」(高精細)、「dramatic lighting」(ドラマチックライティング)などを追加します。ここでは「An oil painting of a panda by Leonardo da Vinci and Frederic Edwin Church, highly-detailed, dramatic lighting」と指定しましたが、額縁が追加されてしまいました。その場合は再実行するか、プロンプト内に「picture frame:-1.0」のように「負の重み付け」をします
DiffusionBeeの場合は、[Options]をクリックすることで生成する画像の設定を変更できます。数値によっては画像生成の処理速度が長くなることや、イメージ通りの画像が生成されない場合があります

 [Options]の設定項目については下記の通りです。

  • Number of Images……1回の生成で作成する画像の数
  • Batch size……同時に生成される画像の数(メモリ16GB以下は「1」を推奨)
  • Resolution……出力する画像の解像度、縦横で768ピクセルまで指定可能
  • Steps……処理のステップ数、増えるほど精細さが増すが処理速度が遅くなる
  • Guidance scale……プロンプトに対してどれだけ忠実に画像を生成するか
  • Seed……設定とプロンプトとシードを一致すると同じ画像が生成される
  • Custom Model……利用する画像生成AIモデルデータを選択
  • Negative Prompt……画像に含めたくないネガティブプロンプトを指定