見出し画像

ぶるぺん流AIイラスト生成術 v1.1

※本記事は2023年2月4日にpixiv FANBOXへ投稿した記事を一部修正したものです。


たまに質問いただいたりいただかなかったりするので自分がAIイラストを投稿するまでの手順をできるだけ詳細に記してみます

基本的にせぴぃ氏の以下の記事のパクリです

使用しているものは AUTOMATIC1111/stable-diffusion-webui のみです
(加筆修正、色調補正などは行わない方針)

-1. 3行要約と完成品

  • テーマは「和装の女性がそよ風を受けながら火炎放射器で🦀を燃やす」

  • AIイラストは真面目な作品作りとかじゃない限り細かい破綻は気にしないほうがいい

  • ChatGPT は神

完成品

0. 基本の設定

モデルはめちゃくちゃ適当にマージしたやつを使ってます

サイズは基本的に 768x512 、人物メインだったら 512x768 で生成します。お題作るときとか場合によっては512の方は変えずに横に長くしたり縦に長くしたりします。
サンプラーは DPM++ SDE Karras、ステップは 20、スケールは9 (モデルによって大きく変わる)

クオリティタグとして以下のものを使っています(以後、省略します)

プロンプト(150トークン)

(masterpiece:1.3),(anime, illustration:1.0), (100 layer, sharp:1.2),
(best quality:1.2), (extremely high quality, high quality, ultra quality:0.8),
(detailed, ultra-detailed, extremely detailed, insanely detailed:1.1),
(intricate, extremely intricate, insanely intricate:1.1),(extremely delicate, insanely delicate:1.0),
(high definition, high resolution, full hd, absurdres:0.8),
(extremely beautiful background, extremely detailed background:1.0),
, , +,

(cute, kawaii:1.0),
(hard light:1.0),
(shadow, shade:1.0),
(reflection, refraction:0.8),
(light rays, dappled light, light glare, lens flare:1.0),
(clear, shiny, glossy, caustics:1.0),
(dynamic:0.4),
(4k, 8k, extremely detailed CG unity 8k wallpaper:0.8),
(detailed eyes:1.0), (beautiful eyes:1.0), 
, , , , , , , , , , , , , , +

ネガティブプロンプト(161トークン):

(NG_DeepNegative_V1_75T:1.4),
(bokeh, blur, blurry:1.0),
(octane render, unity, unreal, maya, realistic, 3D, CG, symmetry:0.4),
(worst quality, low quality, normal quality, lowres, low res:1.2),
(bloom, overexporsure:0.6)
(flat shading, flat color:1.0),
(monotone, monochrome, grayscale:1.0),
(frame, border:1.0),
(text, signature, watermark, username:1.0),

(nsfw:1.0), (blush:1.5), (embroidery:1.0), (holding:0.8), (ring, mole:1.0)

1. 適当にプロンプトを作る

Twitter でなんかお題くれって言ったら flamethrower(火炎放射器) と breeze(そよ風.) を指定されたのでこれを基に考えます

これを送ってきた二人の特性も加味して、今回のテーマは「和装の女性がそよ風を受けながら火炎放射器で🦀を燃やす」になりました
また、題材的に横幅がないと表現できそうにないので768x512 にします

■ テーマを満たせるプロンプトを探す

とりあえず実現可能かわからないのでまず ChatGPT に英文を作ってもらいます

※ 訳: 浜辺に立つ女性が、火炎放射器でカニに火をつけている。その視線は獲物を凝視し、強い意志を感じさせる。炎の熱は強烈で、カニはゆっくりと焼け始める。甲羅と身の焼ける匂いが充満し、女性は満足げな表情を浮かべる。蟹の煙は水平線へと流れていく。

この英文をクオリティタグの後にそのまま放り込みます

A woman standing on the beach ignites a crab with a flamethrower. She looks strong and determined, her gaze fixed on her prey. The heat of the flame is intense, and the crab slowly starts to cook. The smell of burning shell and flesh fills the air, and the woman looks satisfied with her work. The smoke from the crab drifts away into the horizon, a momentary reminder of the woman’s strength and will.
確認用にt2iで生成したもの

何枚か生成したらこれが出てきました
どうみても浜辺で女性が火炎放射器で🦀を燃やしてますね

このテーマは実現可能であることが分かったので細かい要素を肉付けしていきます
見た感じカニが強すぎるので「火炎放射器を持った女性」の要素を強化し、ついでに女性の特徴、breeze や japanese clothes などの要素を追加していきます

(A woman standing on the beach ignites a crab with a flamethrower:1.3). She looks strong and determined, her gaze fixed on her prey. The heat of the flame is intense, and the crab slowly starts to cook. The smell of burning shell and flesh fills the air, and the woman looks satisfied with her work. The smoke from the crab drifts away into the horizon, a momentary reminder of the woman’s strength and will.

((white:0.5) and (multicolored  vermilion hair:1.6):1.1), bob cut, 
(golden eyes:1.3), (japanese clothes:1.2),
beach, (breeze:1.3), sunset
プロンプト調整中…

一発で完成品として出してもいいレベルの物が出てきました
ただ🦀をちゃんと燃やせてないのでプロンプトを微調整しながらガチャを続けます

最終的に以下のプロンプトでまあまあ満足いくものが生成されました

(A woman standing on the beach ignites a crab with a flamethrower:1.3). She looks strong and determined, her gaze fixed on her prey. The heat of the flame is intense, and the crab slowly starts to cook. The smell of burning shell and flesh fills the air, and the woman looks satisfied with her work. The smoke from the crab drifts away into the horizon, a momentary reminder of the woman’s strength and will.

((white:0.5) and (multicolored  vermilion hair:1.6):1.1), bob cut, (golden eyes:1.3), (japanese clothes:1.2),
(holding flamethrower:1.1),
beach, (breeze:1.5), sunset
ベースとなるイラストを生成!

とはいえまだ火炎放射器を手で持ってないので調整が必要です

2. inpaint で気に入らない部分を調整する

先ほどの画像をとりあえず inpaint に送って、火炎放射器を持つように修正します

適当に右手のあたりにマスクをかけて、マスクされたコンテンツを「潜在空間でのノイズ」ノイズ除去強度を「0.85」に設定して inpaint を実行します
(どうしても上手くいかない場合以外は基本的にプロンプト等の設定は変えません)

■ マスクの設定

■ inpaint 後

手が袖で隠れてるってことにしてこれを採用します
この後にどうせ img2img を行うので細かな破綻などは放置します

3. img2img でサイズを大きくする

先ほどの inpaint 後の画像を img2img に送って、縦幅・横幅をそれぞれ2倍に拡大します(768x512 → 1536x1024)
ノイズ除去強度は題材の繊細さに応じて 0.5~0.7 の間で適当に選びます(レア度が高い構図だとノイズ除去強度を高くするとすぐ崩壊する)
今回は修正がめんどくさいのであんまり変わらないように「0.5」にします

無事、細かい部分を維持したまま綺麗になりました

4. inpaint に送って細かい変なところを直す

これで完成でもいいですが、ちょっと気になる部分をもう一度 inpaint して直します
今回は空の🌈みたいなやつが違和感でるようになってしまったのでこれを消します
🦀 の形状はどうせ綺麗になることはないので諦めます(雰囲気伝わればヨシ!)

雲っぽくなりました
まあこれでいいでしょ!

5. アップスケールする(お好みで)

もうほぼ完成なのでこれをアップスケールして投稿します
普通のアップスケールは「その他に転送」から適当にやればいいと思いますが、個人的にSD アップスケールという機能が好きなのでこれを使います

SDアップスケールというのは「普通にアップスケール → 画像を小さく分割 → 分割されたものそれぞれに img2img → 全部結合」っていう手順を自動で行うもので、PCの性能的に不可能な高解像度の画像に対して疑似的な img2img を行うことができるものです
細かい部分が詳細になる(遠くにいる人の顔とか)という効果がありますが、全体的にツルツルになったり濁ったりしがちなので向き不向きがある & 好みが分かれると思います

今回は SD アップスケールでノイズ除去強度を「0.25」にセットし、更に2倍(1536x1024 → 3072x2048)にします

縮小してるとあんまりわかんないですけど多分細かくなってると思います

完成形を改めて眺めたのち、自己満足に浸りながらそのまま Twitter に投稿します
だいたい投稿後におかしい部分が見つかったりしますが基本的に黙っておけばバレません

まとめ

ChatGPT は神

おまけ

より高度なSDアップスケールを実行できる
ultimate-upscale-for-automatic1111 という Extension があるのでSDアップスケールの魅力に取りつかれた人はこちらもお試しください
こちらは設定を柔軟に変えることができます

号泣するレッサーパンダ

この記事が気に入ったらサポートをしてみませんか?