見出し画像

SDXL1.0公開!世界で一番簡単な説明!と使い方!と例!

割引あり

タイトルは釣りです

日本時間の7月27日早朝、Stable Diffusion の新バージョン SDXL 1.0 が正式リリースされました

この記事では、SDXL とは何か、何ができるのか、使ったほうがいいのか、そもそも使えるのかとかそういうアレを説明したりしなかったりします

正式リリース前の SDXL 0.9 の記事にも作例などあります


SDXL って何?

SDXL とは、Stable Diffusion の第3世代(でありベースモデルのこと)です

Stable Diffusion を使った画像生成するときにモデルとかいうものを選択しますが、それらは多分ほぼ全てベースモデルから派生したものです
今回、それの新しいヤツが出たってことですね

Stable Diffusion は2023年7月現在、大きく以下の3バージョンに分けられます

  1. 第1世代 Stable Diffusion v1 ( SD1.4 / SD1.5 )

  2. 第2世代 Stable Diffusion v2 ( SD2.0 / SD2.1 )

  3. 第3世代 Stable Diffusion XL ( SDXL0.9 / SDXL1.0 )

これらの世代の違いはゲームハードに例えるのが一番しっくりきました(刈宮さんが言ってた)
SDv1 が PS3、SDXL が PS4 みたいなイメージです(SDv2は…)

SDXLのイメージはこれ
PlayStation 4 in savanna

やれること(画像生成)は変わらないけど表現力が上がる!みたいな
そして、世代が変わると周辺機器(モデルとかLoRA とか一部の拡張機能とか)の互換性が基本なくなります
使えるようにするにはリメイクしたり、対応したりが必要って感じですね

ちなみに最も普及しているのは Stable Diffusion v1 です
自分が何を使っているかよくわからないという方は、99割 SDv1 系を使っていると思ってよいです

SDXL になったら何が変わるの?

基本性能が凄く上がる!(プロンプトの理解度とか?)
まあよくわからんけどなんかすごいってことです

でも上がるのは基本性能だけなので、チューニングをしないと今主流のイラストやフォトモデルと同じようなものは生成できません!
なので今すぐに移行できるというわけではないことに注意してください

今、主流のモデルたちも SDv1 がリリース(2022年8月)されて1年近く改良が繰り返されてきた結果なので、SDXL もチューニングされることを気長に期待して待ちましょう

SDv1 系で有名なモデル製作者の方々の中にも SDXL に移行することを表明されている方がわりといらっしゃいます!期待大!

がんばれ~
cute pop illustration, cheerleader dog

どうやって使えばいいの?

stable-diffusion-webui を使っている場合は、最新版(1.5.0以降)にアップデートをすることで使えるようになります

使い方は今までと特に変わらず、モデルをダウンロードしてモデルフォルダに放り込んで選択するだけ!
ただし、モデル自体のサイズが大きい(最小で7GBぐらい)のと生成画像のサイズもある程度大きくする必要があるのでPCスペックは結構必要です
(RTX 20XXシリーズ以上推奨ってどっかでみた)

実際に使ってみよう

SDXL1.0 のベースモデルは HuggingFace からダウンロードできます
(ライセンスも正式リリースに合わせて CreativeML Open RAIL++-M License に変更されました)

このモデルを選択して適当に生成してみます!
(refiner というのもありますが無くてもいいのでこの記事では触れません)

ただし、ベースモデルは汎用的な画像を生成できるよう作られているため、画像のスタイルも含めプロンプトで指定する必要があることに気を付けてください
(指定がないと対象物の属性に強くひっぱられます)

以下、全て同じ設定で生成します!

  • 生成画像サイズ:1024x1024

  • サンプリングアルゴリズム: DPM++ SDE Karras

  • サンプリングステップ: 20

  • CFGスケール: 7.5

  • ネガティブプロンプト: なし

  • VAE:なし

プロンプトは基本的には適当に文章を翻訳していれとけば大体なんとかなります

写真風

先頭に photo of とかつけとけば大体写真っぽくなります

カフェで自撮りするネコ
photo of cat taking a selfie in cafe
砂浜でサメを持った老人
photo of old man lifting shark with hand in beach, color

イラスト風

同様に illustration of とかそういうのつければイラストになりやすいです

農業にいそしむロボ
illustration of Robots working hard in agriculture

イラストといってもいろいろあるので自分が望むスタイルをちゃんと指定しないといけません

桜の木の下にいる少女(アニメ風)
anime screencap of girl in school uniform under a cherry blossom tree
高層ビルの屋上から街を見下ろす男(ネオンパンク風)
neon punk art of man is on roof of skyscraper looking down on cityscape

文字を出す

SDXL の大きな特徴として指定した文字を出しやすくなりました
(まだまだ打率は低いけど)

テック企業のロゴ
logo of tech company with company name, "BLUE PEN"
ネコは神
meme, text, "CAT is GOD"

ほかにもいろいろ

パンダの解剖図
anatomy diagram of panda
架空の森の地図
fantasy map of forbidden forest
古代の動物テーマのFPSのスクリーンショット
video game screenshot of FPS game about ancient animals, game ui

面白い使い方はまだまだいっぱいあると思うので色々作ってみてください!

で、結局使ったほうがいいの?

現時点ではおもちゃとして遊ぶぐらいがちょうどいい!

👍👍
little cute mochi mochi slime meerkat smiling and (thumbs up:1.5)

おまけ

SDXLベースモデルでいい感じのものを生成するコツ

基本的にSDv1初期~中期に用いられていたプロンプトがかなり有効です
ちょっと古め(2022年末~2023年2月ぐらい)のプロンプトを探してきて入力してみるとヨシ!

遊びで使う分には、海外有名アーティストや有名なゲームタイトルを入れてみると分かりやすく影響が出るのでおススメです

これは…いいのかな?
bear in uniform standing on mountain in Death Stranding

ちょっと試してみたいけど環境を用意できない人は!

以下の公式サイトで生成することが出来ます
(無料だと1日400枚まで / 生成画像の右下にウォーターマークが付きます)

また、弊 Discord サーバーでも Bot として動かしていて誰でも使えるようにしてあります(全部丸見えだから他の人の作例も見れます!)
ちょっと深いところで SDXL のプロンプト研究もやってたりします

SDXL系モデルの作例

以下、過去にSDXL系列のモデルで作った画像を垂れ流しておきます

SDXL サイコー!


おまけのおまけ

最後にさらなるおまけとして、あの有名な女性のちょっとセクシーな画像とプロンプトを貼っておきます

見たい方は☟からリツイートしていただけると幸いです
(SNSプロモーション機能を使ってみたかっただけのネタなので全く期待しないでください)

ここから先は

606字 / 1画像

この記事が気に入ったらサポートをしてみませんか?