Feldschlacht

としゃーきwikiに書くのがちょっと憚られるような、個人的に関心がある検証内容について…

Feldschlacht

としゃーきwikiに書くのがちょっと憚られるような、個人的に関心がある検証内容について、ここに記録を残します。 検証の要望は受け付けておりません。悪しからず。

最近の記事

グリッド画像の保存と表示は生成速度に影響するのか?(答: ほぼ影響しない)

ヘッダー画像は、txt2img-gridsフォルダに自動保存されてる普段のグリッド画像から選べばいーやと思ったのですが…… くわ~っ!! 駄目だ駄目だ駄目だ!! 序文 皆さんは生成後にギャラリーに表示されるグリッド画像を見ていますか? 私はほとんどの場合、すべての画像の生成が終わるのを待たずにひよこ鑑定作業(=残すか削除するか)を始めてしまいます。先に出来上がった画像からMassiGraで1枚ずつ確認していきます。 MassiGraを愛用している理由は、キーボード右下

    • TesorRT拡張機能のv0.2.0、trtとonnxの中身を空にして動作確認。拡張子変えたんかい。 複数のLoRAの併用、weight反映も確認。 …が、LoRAのサブフォルダを読んでくれなくなったのが不便。 LoRA変換時のプロファイルもおかしい。512x512固定?

      • 昨日TensorRT拡張機能がv0.2.0にアプデされ、様々な改善が施された。 https://github.com/NVIDIA/Stable-Diffusion-WebUI-TensorRT/pull/217 …が、1111起動時にエラーを吐いて、TensorRTタブが表示されない。 issuesには報告が上がっているので様子見。 (※コメントに追記あり)

        • 戦戦戦盗魔のLv13でクリア。僧を抜いて回復をとっこうやく頼みにするか、盗を抜いて宝箱をカルフォ頼みにするか等、PT構成の駆け引きも楽しい。 全体的にテンポの良さが印象的。画面遷移や戦闘演出、入手ゴールドやレベルアップ速度などのバランスについてもそう。操作の反応も軽快。

        グリッド画像の保存と表示は生成速度に影響するのか?(答: ほぼ影響しない)

        • TesorRT拡張機能のv0.2.0、trtとonnxの中身を空にして動作確認。拡張子変えたんかい。 複数のLoRAの併用、weight反映も確認。 …が、LoRAのサブフォルダを読んでくれなくなったのが不便。 LoRA変換時のプロファイルもおかしい。512x512固定?

        • 昨日TensorRT拡張機能がv0.2.0にアプデされ、様々な改善が施された。 https://github.com/NVIDIA/Stable-Diffusion-WebUI-TensorRT/pull/217 …が、1111起動時にエラーを吐いて、TensorRTタブが表示されない。 issuesには報告が上がっているので様子見。 (※コメントに追記あり)

        • 戦戦戦盗魔のLv13でクリア。僧を抜いて回復をとっこうやく頼みにするか、盗を抜いて宝箱をカルフォ頼みにするか等、PT構成の駆け引きも楽しい。 全体的にテンポの良さが印象的。画面遷移や戦闘演出、入手ゴールドやレベルアップ速度などのバランスについてもそう。操作の反応も軽快。

          昨日wizスレで貼られてた https://github.com/shiromofufactory/finardry のURLをクリックしたら1時間経ってた。 ともあれクリアしたので記憶が新しい内にと思いメモを書き始めたが、https://freegame.gamewiki.jp/finardry/ の攻略情報が圧倒的に充実していることを知りボツに。

          昨日wizスレで貼られてた https://github.com/shiromofufactory/finardry のURLをクリックしたら1時間経ってた。 ともあれクリアしたので記憶が新しい内にと思いメモを書き始めたが、https://freegame.gamewiki.jp/finardry/ の攻略情報が圧倒的に充実していることを知りボツに。

          VRAM 12GBでSDXL系列モデルを使用して出力できる最大サイズは?(答: --medvramで1920x1920)

          見出し画像の出力に使用したモデルはCounterfeitXL v2.5です。 SDXL系列モデルの事情 SDXL 1.0が登場したのは2023/7/27。 私は夏頃に少し試したっきりで、まだまだSD1.5系列を愛用しており、SDXL系列にはあまり詳しくありません。 理由は色々。当時はまだSDXL系列モデルが少なくエロ方面に弱かった絵柄の選択肢に乏しかった、LoRA資産を流用できない、必要VRAM量が多い……など。 しかしこの半年で色々と進展がありました。 例えば2023

          VRAM 12GBでSDXL系列モデルを使用して出力できる最大サイズは?(答: --medvramで1920x1920)

          あけましておめでとうございました。 2ヶ月ほどnoteの執筆をサボっており申し訳ございません。 某wikiの方は頑張って編集活動を継続しておりますので、何卒ご勘弁いただければありがたいです。

          あけましておめでとうございました。 2ヶ月ほどnoteの執筆をサボっており申し訳ございません。 某wikiの方は頑張って編集活動を継続しておりますので、何卒ご勘弁いただければありがたいです。

          TensorRT環境でのLoRA+Hires.fixの計測終了。xformersと比べても、56%の高速化(36%の時間短縮)。 注意点として、単一のDynamicエンジンで拡大前・拡大後の両方に対応させる必要がある。

          TensorRT環境でのLoRA+Hires.fixの計測終了。xformersと比べても、56%の高速化(36%の時間短縮)。 注意点として、単一のDynamicエンジンで拡大前・拡大後の両方に対応させる必要がある。

          CPUスレッド数は生成速度に影響するのか?(答: 4スレッド以上はほぼ誤差)

          やあ皆さんエーロ・エロス(挨拶)。チンチコールでもいいですが。 TensorRTとか、Civitaiの課金システム開始とか、PixAIのunderage(未成年)画像規制の強化とか、色々ありますね。忙しくて困っちゃう。 さて前回の記事の最後で とか書いた金髪ツインテエルフが居るそうです。 まさかその直後にTensorRTが来るとはな……。聞いてないぞ……! 通信室へ行く!! 私はTensorRT拡張機能を導入したばかりで扱いにまだ慣れていないのですが、確認したいことが

          CPUスレッド数は生成速度に影響するのか?(答: 4スレッド以上はほぼ誤差)

          TensorRT導入成功。確かに速い。アスカベンチにおいて49%の高速化(33%の時間短縮)。 色々と縛りもある様子なので、手放しでは褒めることはできなさそうだが……。 しかしこりゃあ、なんだか急に忙しくなってしまったぞ。検証したり説明を書く題材が一杯だ。

          TensorRT導入成功。確かに速い。アスカベンチにおいて49%の高速化(33%の時間短縮)。 色々と縛りもある様子なので、手放しでは褒めることはできなさそうだが……。 しかしこりゃあ、なんだか急に忙しくなってしまったぞ。検証したり説明を書く題材が一杯だ。

          FlashAttention-2で画像生成はどの程度高速になるのか?(答: 約10%程度)

          ※この時間は「CPUのスレッド数は生成速度に影響するのか?」をお送りする予定でしたが、予定を変更して「FlashAttention-2」についてお送ります。 ここ数日で、「FlashAttention-2」の導入が比較的容易になりました。 詳細な手順は、後日、某wikiの「最近の主な出来事」に書く予定です(追記: 翌日書きました)が、大まかには次の通りです。 venvに入る pip installで(windows用の)FlashAttention-2を入れる (10/

          FlashAttention-2で画像生成はどの程度高速になるのか?(答: 約10%程度)

          CPUのクロック周波数は生成速度に影響するのか?(答: 少し影響する)

          お久しぶりです。和月です。まあウソなんですが。 随分と間が空いてしまって申し訳ありません。 まあ、記事のネタももうあまりないのです。当初こそ「これ、検証するネタなんて無限にあるな!グヘヘ」と高を括っていたのですが、調子に乗って次々と書いていたらあっという間に枯渇してしまいました。 ただそんな中で後回しにして温め続けていたのがCPU関係です。 PCを再起動してBIOSに入って設定変更して……って面倒くさいよね 極めて高度な政治的判断が必要となるため、やむなく先送りしていまし

          CPUのクロック周波数は生成速度に影響するのか?(答: 少し影響する)

          Live previewsは生成速度に影響するのか?(答: デフォルト設定のままならほぼ影響しない)

          皆さん画像生成中のプレビュー機能は利用していますか? 1111にLive previewsが実装されたのは2023/1のことです。しかもデフォルト設定でONにされていました。新規git cloneした場合だけでなく、git pull等で更新した場合もONになりました。 ですが当時のLive previewsは非常に遅く、生成時間への影響がとても大きいものだったのです。 下記の記事に、2023年1月当時の、速度面への影響が記されています。 【検証】WebUI(1111版)

          Live previewsは生成速度に影響するのか?(答: デフォルト設定のままならほぼ影響しない)

          画像生成のBatch sizeを2以上にすると時間短縮になるのか?(答:わずかに短縮できる)

          大丈夫? ヘッダー画像の時点でオチが見えてない? 気づかないフリを……するんだ(©荒木飛呂彦) 1111のBatch countは、「画像生成処理を繰り返す回数」です。 使用するVRAM量には影響しません。 一方、Batch sizeは、「並列に同時処理する枚数」です。 値を大きくすると、当然ながら、より多くのVRAMを使用します。 例えばBatch count=3、Batch size=2なら、2*3=6で、合計6枚が出力されます。 なおBatch sizeは1~8

          画像生成のBatch sizeを2以上にすると時間短縮になるのか?(答:わずかに短縮できる)

          (再検証)本当にLoRAは生成速度に影響しないのか?(答: 昔はたぶん影響していた。今は影響しない)

          LoRAやTIは生成速度に影響するのか?(答: 全く影響しない) 1週間前に↑こんなこと書いたんですけど。 普段よく読んでるちもろぐちゃん(※やかもち先生です)のとこには、こういう記事があります。 【Stable Diffusion】AIイラストにおすすめなグラボをガチで検証【GPU別の生成速度】 | ちもろぐ この中の、 512×768:神里綾華ベンチマーク 512×768:神里綾華(LoRA)ベンチマーク この2つのテストで、速度がかなり異なるんですよね……。 ど

          (再検証)本当にLoRAは生成速度に影響しないのか?(答: 昔はたぶん影響していた。今は影響しない)

          画像の解像度は生成時間に影響するのか?(答: ほぼ比例する)

          そんなんアタリまえじゃんッ(©板垣恵介) って思いますよね。誰だってそー思う、俺もそー思う。 ここまでは分かりきった話ですが、この記事の中でHires.fixやToMe(Token Merging)についても検証しますので、ひとまずお付き合い下さい。 余談ですが、細かいことを言うと「解像度(dpi等の精細さ)」ではなく、縦×横の「画素数」の話です。でも「解像度」の方が広く浸透しているので、題名では解像度という表現を用いておきます。 テスト環境 RTX 4070 (12G

          画像の解像度は生成時間に影響するのか?(答: ほぼ比例する)