見出し画像

LCMはなぜ高画質なのか?【StableDiffusion】

Stable Diffusion を利用する多くの人が疑問に思っている事だと思いますが、ステップ数の少ない LCM モデルや LCM-LoRA が「高画質」になる理由は、実は簡単です。

SDXL よりも SD1.5 の方が写真に近いという話をしましたが、それと同じです。単純に自由度が少ないからです。潜在空間でズルしてコンストレイントをかけたのが LCM 、LoRA も low rank adaptation なので、行列の Rank(次元)を分解して下げたものです。つまり骨組みのみを扱うという手法です。

なので、紹介されるときに「画質を犠牲にして高速化」は間違いです。「表現の自由さを犠牲にして高速化」が正しいわけです。綺麗な画像しか生成できないというのを「犠牲」と言うかどうかは難しいですが、実際に似たようなものしか生成できなくなります。


この記事が気に入ったらサポートをしてみませんか?