見出し画像

@sd-web-ui-forge. SDXLの低ステップが案外きれいな気がした話

この記事はpaperspaceでの環境はTensorRTは基本使えず、低ステップの画像生成を試してみたところ感じたものになります。
低ステップの高速生成でどこまでいけるかという内容でもあります。
またDPM ++ 2M Karrasが良い感じだったという話でもあります。

A4000が微課金組の中で1番スペックが高いので、それで出来た生成速度について記事にしようとしたら、なんだか低ステップでも良い感じの画像が出来るなという話です。

<検証条件>
解像度は1024x1024です。
通常のSDXLモデルでLCM無しで試しています。※LCM Loraは読み込み時間がかかるため高速生成には向いていませんでした。
civitaiでみるLCMマージモデルやターボモデルを見ると8ステップ前後を推奨しているものが多い感じです。
通常使いのSDXLモデルは20〜25ステップあたりが多いかと思います。
推奨のサンプラーはDPM ++ SDE Karras、Euler aが多い印象。
ですが、面倒だったので、デフォルト設定のDPM ++ 2MKarrasで検討を行いました。

今回はそのデータをベースにしたいと思います。

プロンプト
In light rainy weather, on the quiet streets,
BREAK
a girl stands without an umbrella, her hair and clothes wet from the rain, yet her expression is surprisingly calm.
BREAK
Around her, people hurry to avoid the rain, but she seems to quietly enjoy it.
BREAK
Small raindrops fall on her face, which she gently brushes away.

20ステップ DPM ++ 2MKarras CFG7
9-10秒
これで問題ない気もしてきますね。10秒かからないので。。

10ステップ DPM ++ 2MKarras CFG7
4.7秒 

8ステップ DPM ++ 2M Turbo CFG7
4.3秒

ステップ7  DPM ++ 2M Turbo CFG7
3.6秒

ステップ6  DPM ++ 2M Turbo CFG7
3.3秒

ステップ5  DPM ++ 2M Turbo CFG7
2.9秒

ステップ4  DPM ++ 2M Turbo CFG7
2.4秒
破綻したのが増えてきてます。

ここまで、CFGは7のままでしたが破綻少なくステップが減らせました。失敗率は向上してます。

FreeUを追加すると時間が増えました。
ステップ5  DPM ++ 2M Turbo CFG7
3.5秒 (デフォルトのステップ7と同じくらい)

ステップ6  DPM ++ 2M Turbo CFG7
4.0秒 (デフォルトのステップ7〜8と同じくらい)

ちなみにSAGを使うと
ステップ6  DPM ++ 2M Turbo CFG7
5.2秒 (デフォルトのステップ10と同じくらい)

Latent modifierを追加
ステップ 6  DPM ++ 2M Turbo CFG7
3.9秒 (デフォルトのステップ7〜8と同じくらい)

モデルによる違いがありそうな気がしますが、
ステップ6でもそこそこ良い感じのものが生成出来ています。

これはLatent modifierのパラメータを適当に調整したもの

低ステップの調整はLatent modifierに可能性を感じましたがパラメータが多すぎなので、FreeUで簡単にする方が良い気もします。

私自身、前回記事でLCMを試して見たのはSD1.5でしたが、それだとステップ5とかぼやけていましたし、CFGを7にするとか無理な話でした。
それに比べると、デフォルトで普通のCFGでここまで出来るのは凄いと思いました。

これはforgeだからなのか、サンプラーが良かったのか、モデルが良かったのか。
Automatic1111と比較しようと考えましたがTurboサンプラーがない事実が。。
<追加検証2>
Automatic1111(1.8) DPM ++ 2M Karrasステップ10 シード値4061773927

Forge DPM ++ 2M Karrasステップ10  シード値4061773927

Automatic1111 DPM ++ 2M Karrasステップ8 シード値3697167301

Forge DPM ++ 2M Karrasステップ8 シード値3697167301

Forge DPM ++ 2M Turbo ステップ8 シード値3697167301

Forge Euler a ステップ8 シード値3697167301

Forge Euler Turbo ステップ8 シード値3697167301

SD1.5で試してみる
Automatic1111 DPM ++ 2M Karrasステップ8 

Automatic1111 Euler a ステップ8 

理由は不明ですが、DPM ++ 2M Karrasが低ステップで優秀な印象です。
前回記事を見ると、検討から外れていましたね。。。。

Automatic111とForgeでの差もないようです。ともに最新バージョンですので、内部処理が向上している可能性もあります。

Forgeだとステップ6とかになるとサンプラーはTurboの方が良さそうな結果でした。

また、LCMの際のCFG2とかではなく、通常の7というCFGで作成したというのも大きな相違点です。
xyzプロットを見ると、低CFGだと彩度が下がり、高CFGだと彩度が上がっています。たまたまやったCFG7-8あたりがちょうどいい感じだったようです。

ただ、絵の質感などは高ステップの方が高いのと、低ステップだと失敗率が上がります。また、プロンプト追従性を求めると時間はかかってくると感じました。

この記事が気に入ったらサポートをしてみませんか?