見出し画像

NovelAI [Furry V3] メモ

2024年4月23日実装NovelAI [Furry V3]モデルについてのメモ。

Furry V3モデルについての紹介記事(公式ブログ)。
β版だったケモノ系モデルが刷新されSDXLベースの正式版に。


promptについて

公式記事を参考にしました。
有効なタグの紹介がされていたのでそれと参考画像のメタデータより。

公式紹介Furry V3有効タグ
キャラクター数タグ: solo, duo, group (plus solo focus or duo focus)
体型タグ: anthro, feral, humanoid, animal humanoid, human, taur
背景タグ: detailed background, photo background, simple background, detailed background, amazing background
品質タグ: worst quality, bad quality, normal quality, amazing quality, best quality
美的タグ: very aesthetic, aesthetic, displeasing, very displeasing
その他のタグ: detailed

https://blog.novelai.net/novelai-diffusion-furry-v3-jp-d3722bc774f4

以下、公式参考画像のpromptからのリメイク。

フェアリー系のピンクのケモノ

(prompt)
fairy kei, kemono, very aesthetic, best quality, amazing quality, wallpaper,
(negativ)
worst quality, bad quality, very displeasing, low res, watermark, signature, url, dated, text, english text, spiral eyes, sketch, distracting watermark, hybrid, ancient art, comic sans, logo, artist name, comic panel, unfinished, 4 panel comic, impact (font), trash, chromatic aberration, multi ear,

https://blog.novelai.net/novelai-diffusion-furry-v3-jp-d3722bc774f4


ジムで筋トレしている狼獣人

(prompt)
werewolf, male, fur detail,muscles, gym background , lifting weight,{{{best quality , highres, very aesthetic, amazing quality, awesome, }}}
(negativ)
{{{worst quality}}}, grainy, {very displeasing}, displeasing, unusual eyes, unusual pupils, {{sketch}}, {{{guide lines}}}, {{{unfinished}}}, {{bad quality}}, url, artist name, long image, [enamata], tall image, {{{{{ancient art}}}}}, mosaic, {{sketch page}}, dated, logo, ych, {{{what}}}, japanese text, {{distorted contour}}, sound effects, blurred background ,nipples

https://blog.novelai.net/novelai-diffusion-furry-v3-jp-d3722bc774f4


セーターを着た獣人

(prompt)
ribbed sweater, very aesthetic, best quality, amazing quality, wallpaper,
(negativ)
worst quality, bad quality, very displeasing, low res, watermark, signature, url, dated, text, english text, spiral eyes, sketch, distracting watermark, hybrid, ancient art, comic sans, logo, artist name, comic panel, unfinished, 4 panel comic, impact (font), trash, chromatic aberration, multi ear,

https://blog.novelai.net/novelai-diffusion-furry-v3-jp-d3722bc774f4


月を背景にしたカートゥーン調のポニー

(prompt)
solo, female, pony, ponysona, red eyes, gray fur, orange hair, mohawk, smug, full-length portrait, moon, shadow, landscape, best quality, very aesthetic, wallpaper, amazing background, hi res, flat colors
(negativ)
low res, blurred background, repeated text, url, dated, artist name, worst quality, bad quality, very displeasing, nsfw, 3d (artwork), sweat,

https://blog.novelai.net/novelai-diffusion-furry-v3-jp-d3722bc774f4

サンプラーはEuler Ancestral (step 40~50) / Euler (step 28)
SMEA DYN有効 / SMEA 無効 / SEMA有効 DYN無効
プロンプトを反映する正確度:6~6.2~8.9
など画像により異なる。

有効そうな品質タグ
very aesthetic, best quality, amazing quality, wallpaper, highres, awesome, amazing background, hi res,

有効そうなネガティブプロンプト
worst quality, bad quality, very displeasing, low res, watermark, signature, url, dated, text, english text, sketch, distracting watermark, hybrid, ancient art, comic sans, logo, artist name, comic panel, unfinished, 4 panel comic, impact (font), trash, chromatic aberration, multi ear, grainy, displeasing, unusual eyes, unusual pupils, guide lines, unfinished, long image, tall image, mosaic, sketch page, ych, what, japanese text, distorted contour, sound effects, blurred background , blurred background, repeated text, 3d (artwork),

その他のタグ(要素)
fairy kei (フェアリー系・ジャンル)
kemono (ケモノ・獣人スタイル)
flat colors (フラットな色彩・塗りの指定)

プロンプト設定
設定することで自動的にpromptが末尾に追加される機能です。

「品質タグを加えるON」
{best quality}, {amazing quality}

「除外したい要素:軽い」
nsfw, {worst quality}, guide lines, unfinished, bad, url, tall image, widescreen, compression artifacts, unknown text

「除外したい要素:強い」
nsfw, {{worst quality}}, [displeasing], {unusual pupils}, guide lines, {{unfinished}}, {bad}, url, artist name, {{tall image}}, mosaic, {sketch page}, comic panel, impact (font), [dated], {logo}, ych, {what}, {where is your god now}, {distorted text}, repeated text, {floating head}, {1994}, {widescreen}, absolutely everyone, sequence, {compression artifacts}, hard translated, {cropped}, {commissioner name}, unknown text, high contrast


クオリティ系プロンプトの比較

【基本設定】
prompt:furry, anthro, 1boy
サンプラー:Euler (SMEA=OFF)
step:22
プロンプトを反映する正確度:7
シード値:3466574779
除外したい要素の強さ:100%
プロンプトを反映する正確度の調整:0
ノイズ設定:native

品質タグOFF / 除外したい要素:なし
品質タグOFF / 除外したい要素:強い
品質タグON / 除外したい要素:強い
品質タグONの影響が大きい
品質タグON / 除外したい要素:なし
品質タグON / 有効そうなネガティブプロンプト
品質タグOFF+有効そうな品質タグ / 有効そうなネガティブプロンプト
品質タグON+有効そうな品質タグ / 除外したい要:強い+有効そうなネガティブプロンプト
+SMEA有効

基本プロンプトは品質タグONに設定されている
best quality, amazing quality
が効果あり。

ネガティブプロンプトは
worst quality, bad quality, very displeasing, displeasing
をベースに、

身体的要素
floating head, cropped, multi ear, unusual eyes, unusual pupils, long image, tall image,

テキスト系の要素
watermark, signature, url, dated, text, english text, comic sans, logo, artist name, comic panel, 4 panel comic, impact (font), ych, what, japanese text, distorted contour, sound effects, distorted text, repeated text,  unknown text, commissioner name, hard translated,

表現系の要素
sketch, ancient art, chromatic aberration, grainy, guide lines, mosaic, sketch page, unfinished, blurred background , blurred background, 3d (artwork), high contrast, widescreen, 1994

そのほかの要素
compression artifacts, low res, distracting, hybrid, trash, displeasing, sequence, absolutely everyone, where is your god now

等を目的の描写と品質に応じて組み合わせるのがよさそう。

>masterpieceは有効か?
Furry V3モデルでは絵柄や品質への顕著な変化が無いように思えた。

>1boyや1girlなどのdanbooruタグは有効か?
有効なものと無効なものがある。
同じ意味合いでもタグの表記によって画風が変わるので、好みの画風にするための調整として使えそう。
(「1boy」と「1boy, solo」と「male, solo」で意味は近いはずだが、それぞれ画風が異なる結果になる)

>furry / anthro / kemono / beastman / feral / animal humanoidの違いは?

furry, 1boy, male, solo, best quality, amazing quality
anthro, 1boy, male, solo, best quality, amazing quality
kemono, 1boy, male, solo, best quality, amazing quality
beastman, 1boy, male, solo, best quality, amazing quality
feral, 1boy, male, solo, best quality, amazing quality
四つ足獣
animal humanoid, 1boy, male, solo, best quality, amazing quality
ケモミミ人間

メモ

■再現可能な版権キャラクターの数が増加している。
 今までAnime V3でも再現できなかったニャローテ[ Floragato ]、コライドン[ koraidon ]、ミライドン[ miraidon ]などのポケモンが増えている。
 他ゲームやアニメのキャラクターも。
■アーティストタグはほぼ機能しない(多分)。
 これがAnime V3と大きく違う点。
 学習画像数の多いタグはランダムな画風で出力されるが、学習数の少ないタグを使うと画風が偏る。
■e621タグが有効かもしれない。
 公式がsolo, duo, anthro, feral等のタグを提案しているため。
■SMEA有効で絵の描写量が上がる。
 Anime V3と同様。有無で出力がだいぶ変わる。
■Euler Ancestral(SMEA)はStep数の違いで出力結果が大きく変わる。
 サンプラーの特性。それにしても変化が大きい。

メモしたいものが増えたら追記します。
何かの参考になりましたら幸いです。


参考リンク

※NAI SMEAについて


この記事が気に入ったらサポートをしてみませんか?