Stable Diffusionプロンプトジェネレータ
生成したプロンプトで実際に Stable Diffusion の画像作成を試したい方はこちら。
これは何?
Stable Diffusionで画像を生成するために使用されるプロンプト(呪文)を、カンタンな選択肢を選択するだけで自動的に生成できるStable Diffusionのプロンプト自動生成ツールです。
Stable Diffusionではプロンプトに応じてあらゆる画像を生成することができますが、プロンプトの選択肢を考慮するうえで項目が余りにも多くなってしまうため、このツールでは人物の含まれる画像を出力することを前提とし、関連する選択項目を用意してみました。
英語に翻訳するのが面倒な方、Stable Diffusionで画像を作ってみたいけどよくわからない方、それっぽい画像がなかなか作れない方、などStable Diffusionの使い方のヒントになれば幸いです。
使い方
上記のジェネレーターの選択項目を選ぶだけです。必要な項目だけを選べば最低限のプロンプトが出力されますが、できるだけそれぞれの項目を選んだ方がより具体的な画像が生成できるはずです。
各項目の「この項目を優先する」にチェックを入れるとその命令が特に反映されやすいようにプロンプトを変更します。※(())を自動的に付加します。
このツールについて
この、Stable Diffusionプロンプトジェネレータは、ChatGPTにおおよその作り方を聞きながらコーディングしました。
その時の会話の一部などはこちらにもまとめています。
実際はこの会話の後も動作させるコードを調整しましたが、ChatGPTはソースコードのフレームを丸ごと作ってくれたり、スクリプトのリファレンスを詳しく教えてくれるので非常にスムーズに作業が進みました。
当サイト「AIに(ai-ni.jp)」は、AIに全力で頼って作ったAIとの会話まとめサイトです。ChatGPTといろいろな会話を行ってみるだけでなく、実際にいろいろな仕事の解決策をまるごとAI教えてもらっていろんなことを解決しようと試みていきますので、ご興味があればその他のページなどもぜひご覧ください。
その他、ジェネレータの選択肢の追加、修正、この機能はこうしたほうがいいよ、などアドバイスやご要望があればぜひお知らせください。
Stable DiffusionやプロンプトについてのFAQ
- QStable Diffusionでかわいい女の子が作れない
- A
Stable Diffusionは利用する学習データによって生成される画像が大きく異なります。Stable Diffusion OnlineではStable Diffusionを開発したCompVisグループが用意した学習モデルが利用されていますが、その他に人物写真を中心に学習したモデルやイラストを中心に学習したモデルなどを利用することで目的に沿った画像に近づけることができます。
例として、Stable Diffusion Onlineと、2次元イラストの学習に特化したAnythingのモデルを使って、全く同じプロンプトを使って画像を生成すると以下のようになります。
Stable Diffusion Onlineで作った画像
Anythingモデルで作った画像
どちらも全く同じ呪文から生み出された美少女です。
上記の通り、そもそも使われている学習データによってできあがる画像には傾向や限界があります。任意の学習モデルを利用した画像生成を行うためにはそれらに対応したWebサービスなどを利用するか、自分のPCなどを使ってローカルでStable Diffusionを実行できる環境を構築することで実現が可能です。
- QStable Diffusionで指定通りのポーズ、構図にならない
- A
100%プロンプトの指示が反映されるわけではないので何とも言えませんが、プロンプト内の優先度を調整すると期待通りの画像に近づけられるかもしれません。
Stable Diffusionではプロンプト内の特定のキーワードをかっこ () で囲むことで、その要素を優先的に重視した画像が生成できます。
このツールでは「この項目を優先する」チェックボックスをオンにすることで、対象の項目のプロンプトに自動的にかっこを付与して優先されるように試みますので、まずはこの機能を試してみてください。
なお、一部の選択項目同士は組み合わせが矛盾するものなどもあります(遠景、広角のポートレート、のような)。そのような設定では精度が落ちてしまうので、選択項目を「(指定なし)」にして除外したほうがより期待通りの画像になる場合があります。また、現在出力しているプロンプトの英語表現が適切でない可能性もあります。こうしたほうがいいよ、などアドバイスやご要望があればぜひお知らせください。
- QStable Diffusionプロンプトジェネレータの選択項目以外で指定したほうが良い要素は?
- A
モデルの髪型や容姿、服装やアクセサリなどの細かい要素は選択項目がまだないのでこのあたりを付け加えていただくとよりイメージに沿った画像が生成できると思います。
このツール自体は当サイトの「AIに頼る。AIに仕事させる。」のコンセプトに従ってAI(ChatGPT)の生成する項目洗い出し、コード設計の情報などを参考に最小限の労力で作ってみました。もう少し精度を上げるための項目の追加やツールの利便性を上げるためのアイデアもあるのですが、そこそこ面倒なのでそのあたりは順次追加していこうと思います。
- Qイラストのタッチや写真の雰囲気などがイマイチ
- A
このツールでは一般的な用語を使ってプロンプトを生成しています。
実際にStable Diffusionでより精度の高い画像を生成したい場合、より効果が高い方法として「〇〇が描いた絵のような」や「〇〇の映像作品」「アーティスト〇〇の画風」「写真家〇〇の構図」「〇〇のサイトに掲載されている画像」のように、アーティストや作品の持つ特性を模倣するようなものがあるのですが、このツールではそのような固有名詞や商標、作品名などを使ったプロンプトを含めることは避けています。
イラストのタッチや写真の雰囲気などを似せたい場合は「その他の呪文」のボックスにそれらの用語を入れて試してみてください。
- Q〇〇の指定はできないの?
- A
Stable Diffusionプロンプトジェネレータの選択肢の追加、修正、この機能はこうしたほうがいいよ、などアドバイスやご要望があればぜひお知らせください。
バージョン履歴
- 2023/03/11公開