Mac Info
画像生成AI「Stable Diffusion」を手軽に使ってみよう!
2023年3月7日 12:05
2022年にStability AIがオープンソースで公開した「Stable Diffusion」は、ディープラーニング(深層学習)によって入力したテキストから画像を自動作成する画像生成AIです。当初Macで利用するには自らセットアップして実行環境を構築する必要がありましたが、現在はStable Diffusionを組み込んだアプリがたくさんリリースされ、誰もが簡単に利用できます。その中でもまず一番に試してみたいのが、Macで動作する「DiffusionBee」というアプリ。ここではDiffusionBeeの基本的な使い方に加えて、目的の画像を上手に生成するための方法についても解説していきます。
画像生成AIを使う前の注意点
オープンソースとして公開されているStable Diffusionを組み込んだMac用アプリは多数存在します。その中でも、DiffusionBeeはテキストからの画像生成に加え、すでにある画像から新しい画像を生成したり、画像の一部を加工したり、解像度を上げたりできるなど非常に多機能なのが特徴です。
アプリは無料でダウンロードできるので、ぜひ気軽にインストールしてみましょう。ただし、利用するうえではいくつかの注意点があります。まず、1つはアプリケーションのサイズです。
DiffusionBeeに限らず、こうした画像生成AIアプリをMacのローカル環境で実行するには画像を生成するための「モデルデータ」をダウンロードする必要があり、そのサイズは数GBを超えることがあります。ストレージに十分な空き容量があるかどうか、インストール前に確認しておきましょう。
次に注意したいのが、対応するMacです。DiffusionBeeでは現行のApple Silicon向けのバージョンと、Intel製CPUを搭載したMac(Intel Mac)向けのバージョンが公開されていますが、実際に利用するうえではApple Silicon(M1またはM2チップ)を搭載したMacのほうが高速に処理できます。
Intel Macを使っている場合は画像生成に時間がかかることがありますので、画像生成AIの真の実力を知るうえではできる限り現行のApple Silicon搭載Macで試すほうがいいでしょう。また、画像生成時には大量のメモリを消費するので、実行中はほかのアプリを終了するなどの対策もしておきましょう。
DiffusionBeeの基本的な使い方
DiffusionBeeの使い方はとてもシンプルです。インストール終了後にアプリを起動してメイン画面が表示されたら、[Text To Image]タブの入力欄にテキスト(プロンプトと呼ばれます)を英語で入力。そしてあとは[Generate]ボタンをクリックすれば、自動で画像が生成されます。
しかし、目的の画像を得るのは一筋縄ではいきません。というのも、どんなプロンプトを入力するかによって生成される画像が大きく変わるからです。
1つや複数の単語を入力するだけではうまくいかず、時には説明文のように複雑な言葉を組み合わせて入力しないと目的の画像が生成されないこともあります。目的の画像を得るには、SNSなどでよく言われるようにプロンプトを上手に組み合わせた「呪文」を生み出す必要があるのです。
ネットを検索するとさまざまなプロンプトが作例とともに多数紹介されているので、ぜひ参考にしてみましょう。最初から思い通りの画像を出力するのは難しいと思うので、まずはプロンプトをそのままコピーして試してみるのがおすすめです。
また、DiffusionBeeのメイン画面から[Prompt Ideas]タブをクリックすると「ArtHub.ai」というサイトが表示され、DiffusionBeeを利用して作られたイラストやそのプロンプトを確認でき、プロンプトはコピーして利用できます。
さらに、メイン画面の[Styles]からプロンプトの種類を参照することも可能です。[Drawing Style](描画スタイル)や[Visual Style](絵のスタイル)、[Pen](ペンの種類)、[Carving and Etching](彫刻とエッチング)、[Camera](カメラ)、[Color](色)といったさまざまなプロンプトが掲載されており、クリックすることで入力できます。
イメージ通りのイラストを作成するには
DiffusionBeeをもっと上手に使いこなしたいと思ったら、プロンプトについてしっかりと学んでみましょう。そのためにはStable Diffusionを公開したStability AIのサイトに掲載されている「Promt Guide(プロンプトガイド)」が役立ちます。
そこで説明されている内容をかいつまんで紹介すると、目的の画像を得るためにまず重要となるのは、画像の主題となる「コアプロンプト」とその画風を表わす「スタイル」の指定であること。これらがもっとも画像生成に大きな影響を与えます。
また、コアプロンプトとスタイルに加えて、実在する画家やイラスト投稿サイトの特徴である「アーティスト」のプロンプトをさらに追加すると、多くの場合で良好な結果が得られる可能性が高まります。
さらに、背景や光の当たり方などの条件を細かく追加していくことも可能ですが、プロンプトが長文になるほど予想しなかった影響が出力されることがあります。その場合は、そのまま画像を再生成するか、要素の重み付けを減らすプロンプトを追加してから画像を生成するなど試行錯誤を繰り返すようにしましょう。
なお、画像生成のオプション項目にある数値を変更することで、出力される画像の傾向や精細度が変わってくることも説明されています。もちろん、これらのテクニックを使えば必ずイメージに近い画像が生成されるというわけではありませんが、AIのプロンプトの解釈が安定し、目的の画像に近い画像が生成する可能性が高まるでしょう。
[Options]の設定項目については下記の通りです。
- Number of Images……1回の生成で作成する画像の数
- Batch size……同時に生成される画像の数(メモリ16GB以下は「1」を推奨)
- Resolution……出力する画像の解像度、縦横で768ピクセルまで指定可能
- Steps……処理のステップ数、増えるほど精細さが増すが処理速度が遅くなる
- Guidance scale……プロンプトに対してどれだけ忠実に画像を生成するか
- Seed……設定とプロンプトとシードを一致すると同じ画像が生成される
- Custom Model……利用する画像生成AIモデルデータを選択
- Negative Prompt……画像に含めたくないネガティブプロンプトを指定