gcem156

生えてる子が好きです。

29 フォロー 417 フォロワー

固定された記事

Stable-Diffusionの学習設定まとめ

　なんか学習設定について、よく分からんけどデフォルト！とかよく分からんけどこうしてみたらうまくいった！みたいな感覚で議論されていることが多い気がするので、学習設…

gcem156

1年前

154

8x7B=47B？

Mixtral「7×8は56じゃないぞ！オレたちは7×8で47だ！6.7倍だぞ6.7倍！」　MoEモデルのパラメータ数について気になったので調べてみました。 Mistral-7Bのパラメータ数…

gcem156

1か月前

Dart+WD-Taggerでプロンプトの忠実度を計測してみる

　最近出てきたプロンプト生成器とWD-Taggerのv3 を組み合わせて、 Dartでプロンプト生成生成したプロンプトで画像を生成 WD-Taggerでプロンプトを予測 1と3のプロ…

gcem156

2か月前

ControlNetの軽量版？つくった

　ControlNetはすごいですが、UNetの3分の1～2分の1くらいの大きさのモデルが余計に必要です。今回は軽量なモデル＋LoRAだけでControlNetみたいなことをやってみます。 Co…

gcem156

2か月前

Stable Diffusionの学習コードを作る：5.ControlNet編

　今回はControlNetの学習についてやっていきます。以下のような設定を増やすことで学習できるようにします。 controlnet: train: true resume: null # model file path…

gcem156

2か月前

[ComfyUI]SamplerCustom宣伝記事

　今回は、ComfyUIにおける最強ノードである、SamplerCustomの宣伝をする記事です。　この記事の画像は全てanimagineXL-3.0及びDartが作ってくれたプロンプトを使ってお…

gcem156

3か月前

Stable Diffusionの学習コードを作る：4.LCM-LoRA編

　今回は、LCM-LoRAの学習についてやっていくよ。じつはコードの作り直しをした最大の理由はこのLCM-LoRAを簡潔に実装するためだったんだよ。 https://github.com/laksjdj…

gcem156

3か月前

Stable Diffusionの学習コードを作る：3.LoRA編

　前回はフルファインチューニングをやりましたが、今回はLoRAの学習ができるようにします。 NetworkManager　モデルへ追加ネットワークを適用する処理を行うクラスです。…

gcem156

3か月前

Stable Diffusionの学習コードを作る：2.学習編

　前回の続きとして、学習のために必要なコードを紹介していきます。今回はLoRAではなく、フルファインチューニングができるようにします。データセット（BaseDataset）…

gcem156

3か月前

Stable Diffusionの学習コードを作る：１.生成編

　学習コードに変な機能がいっぱい増えてわけわからなくなっちゃったので作り直すことにしました。せっかくなので記事にしてみます。完全なオレオレ学習コードなので全くゆ…

gcem156

3か月前

Stable Diffusion学習の歴史

　完全に自分目線の歴史です。時系列は適当なこともあるよ。 2022/8　モデルが公開されましたが、学習を始めた人は一部だけでしょう。 Stable Diffusionリリース 22日 …

gcem156

3か月前

ComfyUIにおけるUNet改造ノードの作り方

誰が得するんだろうこんな記事 ComfyUIのカスタムノードについて新しいノードを作るには、以下の記事が詳しいです。　UNetを改造するとき、たとえばMODELを受け取って好…

gcem156

5か月前

学習不要のUNet改変法まとめ

　最近になって、UNetの構造をいじって生成速度をあげたり、品質を高める方法が色々提案されたのでまとめてみます。 UNetについて　過去に記事をあげてたと思います。UNet…

gcem156

5か月前

LCM-LoRAについて

　学習や生成をいろいろ試して分かったことをまとめます。 LCM-LoRAとは　ただのLoRAです。サンプラーが変わったりCFG_scaleが1に近い値を設定しないといけなかったりとち…

gcem156

5か月前

Latent Consistency Modelによる蒸留を試してみた

　1～8ステップくらいで画像生成ができるようになるLatent Consistency Modelをつくります。まずはLatent Consistency Modelの説明をし、次に蒸留体験記を書いていきます。…

gcem156

6か月前

SDXLの軽量版モデルからアニメモデルをつくる

SDXLの軽量版とかいうのが出てきたのでこれをアニメ化します。できたモデルはい https://huggingface.co/furusu/SSD-1B-anime モデルについて　このモデルは説明には載…

gcem156

7か月前

gcem156

2023年5月18日 19:49

Stable-Diffusionの学習設定まとめ

　なんか学習設定について、よく分からんけどデフォルト！とかよく分からんけどこうしてみたらうまくいった！みたいな感覚で議論されていることが多い気がするので、学習設定についてまとめてみようと思います。機械学習のこと知らん人にも分かるようにするはずの記事でしたが多分そうなってないです。間違いもあると思いますが、私の記事が間違っていたとしても、悪いのは私よりも頭がいい人が分かりやすい説明をしないせいであっ

もっとみる

gcem156

2024年4月11日 18:07

8x7B=47B？

Mixtral「7×8は56じゃないぞ！オレたちは7×8で47だ！6.7倍だぞ6.7倍！」

　MoEモデルのパラメータ数について気になったので調べてみました。

Mistral-7Bのパラメータ数　まずはただの7Bモデルについてみていきます。何番煎じだ？
実装はここみたい
https://github.com/huggingface/transformers/blob/main/src/tran

もっとみる

gcem156

2024年3月16日 15:41

Dart+WD-Taggerでプロンプトの忠実度を計測してみる

　最近出てきたプロンプト生成器

とWD-Taggerのv3

を組み合わせて、

Dartでプロンプト生成

生成したプロンプトで画像を生成

WD-Taggerでプロンプトを予測

1と3のプロンプトを比較

すればモデルのプロンプトへの忠実度測れるんじゃねということを思いついたのでやってみます。

　前置きが長すぎる気がするので、とばしましょう。少なくとも俺だったら読まない。

設定　Dar

もっとみる

gcem156

2024年3月7日 21:29

ControlNetの軽量版？つくった

　ControlNetはすごいですが、UNetの3分の1～2分の1くらいの大きさのモデルが余計に必要です。今回は軽量なモデル＋LoRAだけでControlNetみたいなことをやってみます。

ComfyUI用実装

https://github.com/laksjdjf/LoRTnoC-ComfyUI

あーきてくちゃあ　ControlNetは基本的にUNetのIN+MIDブロックのコピーですが、

もっとみる

gcem156

2024年3月6日 21:37

Stable Diffusionの学習コードを作る：5.ControlNet編

　今回はControlNetの学習についてやっていきます。以下のような設定を増やすことで学習できるようにします。

controlnet: train: true resume: null # model file path transformer_layers_per_block: false # default = false global_average_pooling: false

もっとみる

gcem156

2024年2月25日 16:29

[ComfyUI]SamplerCustom宣伝記事

　今回は、ComfyUIにおける最強ノードである、SamplerCustomの宣伝をする記事です。

　この記事の画像は全てanimagineXL-3.0及びDartが作ってくれたプロンプトを使っております。プロンプト考えなくていいの最高や～～。

画像生成ノード　ComfyUIの画像生成ノードにはKSampler（雑魚）やKSampler(Advanced)（ゴミ）があります。この二つに比べてS

もっとみる

gcem156

2024年2月17日 12:44

Stable Diffusionの学習コードを作る：4.LCM-LoRA編

　今回は、LCM-LoRAの学習についてやっていくよ。じつはコードの作り直しをした最大の理由はこのLCM-LoRAを簡潔に実装するためだったんだよ。

https://github.com/laksjdjf/sd-trainer/blob/main/modules/lcm/lcm_trainer.py

スケジューラー　実装はめっちゃ簡単です。学習時にddimを使うので、分岐しています。こうしてみ

もっとみる

gcem156

2024年2月17日 12:44

Stable Diffusionの学習コードを作る：3.LoRA編

　前回はフルファインチューニングをやりましたが、今回はLoRAの学習ができるようにします。

NetworkManager　モデルへ追加ネットワークを適用する処理を行うクラスです。今回はLoRAしかやりませんが、後々LoHAとかいろいろなものを実装する予定なので、NetworkManagerという名前になっています。そのくせ変数名がlora前提になっていたりとちょっと見直さなきゃいけない部分もあり

もっとみる

gcem156

2024年2月17日 12:44

Stable Diffusionの学習コードを作る：2.学習編

　前回の続きとして、学習のために必要なコードを紹介していきます。今回はLoRAではなく、フルファインチューニングができるようにします。

データセット（BaseDataset）データセットのフォルダ構造は以下のような感じです。フォルダ名はデフォルトの名前であって、設定で自由に変えられるようにします。

Dataset/ buckets.json # bucketingのメタデータ original

もっとみる

gcem156

2024年2月17日 12:44

Stable Diffusionの学習コードを作る：１.生成編

　学習コードに変な機能がいっぱい増えてわけわからなくなっちゃったので作り直すことにしました。せっかくなので記事にしてみます。完全なオレオレ学習コードなので全くゆうざあふれんどりぃでないものになる予定です！
　方針として、モデルの定義以外は自前で実装します。モデルの定義はhuggingfaceとの連携辺りがめんどくさいのでやりたくないです。
　※Noteに貼り付けているコードはGithubのものより

もっとみる

gcem156

2024年1月31日 19:26

Stable Diffusion学習の歴史

　完全に自分目線の歴史です。時系列は適当なこともあるよ。

2022/8　モデルが公開されましたが、学習を始めた人は一部だけでしょう。

Stable Diffusionリリース 22日

　これまでの画像生成AIと違いモデルがオープンになったことで、誰でも自由に学習できるようになりました。StabilityAIが公開したコードには学習コードも含まれていたので、技術力さえあればこの時点で学習できた

もっとみる

gcem156

2023年12月19日 19:39

ComfyUIにおけるUNet改造ノードの作り方

誰が得するんだろうこんな記事

ComfyUIのカスタムノードについて新しいノードを作るには、以下の記事が詳しいです。

　UNetを改造するとき、たとえばMODELを受け取って好き勝手いじって、MODELを出力するという話なら簡単です。しかし入力時にコピーされるわけではないので、適当に改変してしまうと入力側も変わってしまいます。ComfyUIはノードベースの生成UIであり、複数のノードにMODE

もっとみる

gcem156

2023年12月9日 14:59

学習不要のUNet改変法まとめ

　最近になって、UNetの構造をいじって生成速度をあげたり、品質を高める方法が色々提案されたのでまとめてみます。

UNetについて　過去に記事をあげてたと思います。UNetはIN層・MID層・OUT層に分かれます。downとかupとか呼ばれることもありますが、今回はIN/MID/OUTで統一します。IN層では入力がどんどん縮小されていって、OUT層では元のサイズに戻っていきます。UNetは一直線

もっとみる

gcem156

2023年12月2日 10:55

LCM-LoRAについて

　学習や生成をいろいろ試して分かったことをまとめます。

LCM-LoRAとは　ただのLoRAです。サンプラーが変わったりCFG_scaleが1に近い値を設定しないといけなかったりとちょっと特殊ですが、結局LoRAであることは変わりません。

サンプラーについてLCMサンプラーは意外と直感的に理解できます。Euler ancestralの究極版みたいな感じです。
以下は1ステップ分の図です。左の完

もっとみる

gcem156

2023年11月6日 20:12

Latent Consistency Modelによる蒸留を試してみた

　1～8ステップくらいで画像生成ができるようになるLatent Consistency Modelをつくります。まずはLatent Consistency Modelの説明をし、次に蒸留体験記を書いていきます。

性能は微妙ですが、個人的にはうまくいくことが分かっただけで満足です。生成なんてしないしー。

拡散モデル　目を瞑って想像してみてください、あなたは深い森の中に迷い込んでしまいました。その

もっとみる

gcem156

2023年10月29日 10:07

SDXLの軽量版モデルからアニメモデルをつくる

SDXLの軽量版とかいうのが出てきたのでこれをアニメ化します。

できたモデルはい

https://huggingface.co/furusu/SSD-1B-anime

モデルについて　このモデルは説明には載ってないですが、おそらくこの論文から着想を得ています。なぜそう言えるかというと同じ人がこの論文通りのSDv1.5軽量版をアップロードしてるからです。そちらはあんまり話題になってないですね。

もっとみる

記事一覧

Stable-Diffusionの学習設定まとめ

8x7B=47B？

Dart+WD-Taggerでプロンプトの忠実度を計測してみる

ControlNetの軽量版？つくった

Stable Diffusionの学習コードを作る：5.ControlNet編

[ComfyUI]SamplerCustom宣伝記事

Stable Diffusionの学習コードを作る：4.LCM-LoRA編

Stable Diffusionの学習コードを作る：3.LoRA編

Stable Diffusionの学習コードを作る：2.学習編

Stable Diffusionの学習コードを作る：１.生成編

Stable Diffusion学習の歴史

ComfyUIにおけるUNet改造ノードの作り方

学習不要のUNet改変法まとめ

LCM-LoRAについて

Latent Consistency Modelによる蒸留を試してみた

SDXLの軽量版モデルからアニメモデルをつくる