見出し画像

『創作の庭』用【プロンプト付きキャラクターカード】『ケンタウロス少女』

===========================
(「このプロンプトを作るに到った経緯」を書く欄)(日記的なもの)

前回の実験で、画像生成AIで、「ケンタウロス少女」を作る実験をしてみたところ、「ケンタウロス」のように、普通ではない形状は、画像生成AIは出力が極端に苦手な物があるという事がわかった。
前回の実験の最後では、次のように、「何となくケンタウロス少女に見える」位の段階にまではきていたので、ここから、きちんと、どのようにすれば、「ケンタウロス少女」の形状が安定して出力できるのか?を、「プロンプトエンジニアリング」をやらなければいけなくなったが、これが、思った以上に厄介だったが、ようやく、「どのようにすれば、「ケンタウロス少女」の形状になるのか?」がわかってきたので、その順番を書いていきます。

(画像生成AIで、「ケンタウロス少女」の形状になるまでの段取り)
(1) 前回の実験の最後の段階のプロンプトと英語の意味は次の通り。
An anime-style centaur girl with long blonde hair and blue eyes, smiling and holding a bow and arrow, in a forest. She has the upper body of a human. and the lower body of a horse.

長いブロンドの髪と青い目をしたアニメ風のケンタウロスの女の子が、森の中で弓矢を持って微笑んでいます。 彼女は人間の上半身を持っています。 そして馬の下半身。

(出力画像)

(2) 上の段階では、若干インチキで、肝心なケンタウロスの馬の4本足が出てきづらい。
どうすれば、「馬の4本足」が出る画像の出力ができるのか?を考えた結果、きちんと、プロンプトに、「Centaur walking on four horse legs.(ケンタウルスは馬の 4 本足で歩きます)」を追加した。
この段階で、きちんと、「ケンタウロスの馬の4本足」付きの画像が出やすくなった。
のだが、一方で、「馬」形状を指定し過ぎているので、「馬」の形状に画像生成AIが引っ張られるようで、次のように、「馬の頭の位置に、いきなり、人間の首が付いている」という状態になった。

(なんかバランスが悪い)

「ケンタウロス」というのが、あまりにも、画像生成AIにとって、不自然な構造をしており、「彼女は人間の上半身を持っています。 そして馬の下半身」という説明だと、そもそも、「馬は胴体部分と、首部分」であって、「上半身と下半身」の形状になっていない。
それで、「馬の首の位置に、人間の女性の上半身部分が、腰の位置でくっついている」のように正確な描写で記述した所、余計に、異様な姿が出力されるようになってしまい失敗。

(3) とりあえず、元に戻して、さっきの状態で、ほとんど、ケンタウロスの形状の「ケンタウロスの馬の4本足」部分+「馬の首の位置に人間の頭が付いている」まで近づいてきているので、ここを基準に、改良する事にした。
いろいろと考えたあげく、「ああ、そうだ、人間の女性の上半身を馬の首の位置につなげる」わけだから、「人間の上半身と人間の腕の描写が入っていれば、そこを、人工知能が削除できなくなる」と思って、
・「holding a bow and arrow, poses to shoot a bow(弓と矢を持って、弓を射るポーズ)」
をプロンプトに加えて、人工知能が、「人間の腕」を削除できないようにした所、この手法が当たりだった。
すでに、プロンプトに、
・「彼女は人間の上半身を持っています」
が入っているので、「holding a bow and arrow, poses to shoot a bow(弓と矢を持って、弓を射るポーズ)」のプロンプトが加わった事で、
・「人間の上半身部分から、人間の弓を射るポーズの腕を削除できなくなった」
事で、「いきなり馬の首の位置に、人間の首が付いている」という処理を人工知能がしづらくなって、結果として、きちんと「ケンタウロス少女」の形状に、比較的安定的に出力させる事に、やっと成功した。
いろいろやってみた所、この「弓を射るポーズ」がある事で作画崩壊しやすいが、一方で、これを削除してしまうと、「馬の首の位置に、人間の首がつながっている」画像が出やすくなるなど、むしろケンタウロスの形状にならなくなってしまうので、この「弓を射るポーズ」というプロンプトが削除できない。
自分の目標は、「ケンタウロス少女」だけを作る目的ではない為に、とりあえず、「ケンタウロス少女」の形状で画像出力はできるようになったので、今回は、ここまででとりあえずやめる事とした。

(4) もっときちんと「ケンタウロス少女」を作って、「RPGゲーム風の1シーンのイメージボード作成」のような事をしたい人は、今回の自分の「ケンタウロス少女」のプロンプトを使えば、大体、20枚に1枚位の頻度で、きちんとケンタウロスに見える形状の画像が出てくるので、とにかく、ガチャの回数をこなして、「いい構図」のケンタウロス画像を出力する。
次に、他の画像生成AIに持って行って、その「ケンタウロス少女」の画像を「構図」指定用に使用する。という手法を使えば、かなり楽に、厄介な画像生成AIの出力が極端に苦手な物である、普通の形状をしていない「ケンタウロス少女」を画像生成AIで、やっと作れるようになる。

大体、20枚に1枚位の頻度だが、やっと、「ケンタウロス少女」の形状で画像出力できるようになったプロンプトは次のキャラクターカードの通りです。

===========================
(「創作の庭」データベース用)
・(使いたいイメージが最も出ている画像)

・(キャラクター名(仮)) 『ケンタウロス少女』

<プロンプト形成時のデータ>
・(初期主題) 『ケンタウロス少女』(もともとは何を作ろうとしていたのか?を書く場所。要するに、最初に入力したプロンプト)

・(このキャラの召喚呪文プロンプト)(あえて、「召喚呪文プロンプト」と呼んだ方が、キャラクターに愛着が出てイメージを膨らませやすい)

An anime-style centaur girl with long blonde hair and blue eyes, smiling and holding a bow and arrow, poses to shoot a bow, in a forest. She has the upper body of a human. and the lower body of a horse. Centaur walking on four horse legs.

・(プロンプト出力時に使った画像生成AIの種類とバージョン)
Bing Image Creator(中身は、DALL·E)(マイクロソフトの「Edge」の中の人工知能機能。バージョンはよくわからない)(*画像生成AIは、バージョンで出力される結果が大幅に変わってしまうので)

・(プロンプトのGoogle翻訳)
森の中で、長いブロンドの髪と青い目をしたアニメ風のケンタウロスの女の子が、微笑みながら弓矢を持ち、弓を射るポーズをとっている。 彼女は人間の上半身を持っています。 そして馬の下半身。 ケンタウルスは馬の 4 本足で歩きます。

・(プロンプト召喚可能頻度)画像生成AIの出力が極端に苦手な物である、「普通の形状をしていないもの」に「ケンタウロス」の形状があるので、いろいろとやってみた結果、ようやく、「ケンタウロス」の形状の全体像が出るプロンプトが完成した。頻度は、大体、20枚に1枚位の頻度。画像生成AI内のビッグデータ内に、「ケンタウロス(centaur)」のタグの画像が増えていくと自然に出るようになると思われる。(*このプロンプトを利用して、どの程度の頻度で目的の画像が出やすいかメモ)

<言語学メモ>
一応、中の人が辞典学者なので、「ケンタウロス」という単語や、英語のプロンプトの「centaur」の言語学的にややこしい部分の話の説明を書くと、
・ギリシャ語は、イタリア語、フランス語、ドイツ語なんかと同じで、単語に、男女の性という文法部分が付いてきます。
例えば、イタリア語で、イタリア人が自分の子供が産まれてくる時に、女の子が産まれたら「Maria」、男の子が産まれたら「Mario」のように、語尾を男性形、女性形の文法法則で代えるだけで、簡単に、変更できる。
ですから、日本のように、出産前に、「男の子が産まれてくると思って、男の子の名前を親が考えていたら、実際には、女の子だった!」というような場合の名前の性別の違いによる変更は、このような、単語に、男女の性という文法部分がある言語の国では、とても簡単です。
ですから、任天堂の「Mario」が世界的大ヒットとなり世界中に愛されて受け入れられている理由は、実は、言語学的な理由で、キリスト教圏の信仰のある「Maria」の文法的な男性形が、「Mario」だからなのです。

(「ケンタウロス」という単語の言語学的なややこしさ)
「ケンタウロス」という単語の言語学的なややこしさは、次のような状況です。
・<英語> ((単数形)centaur), ((複数形)centaurs)
しかし、本当のギリシャ神話のギリシャ語では、
・<ギリシャ語>((単数形,主格)κένταυρος), ((複数形,主格)κένταυροι)(*ギリシャ語は、さらにややこしい事に、「古典ギリシャ語」という大幅に文法が異なるものがあります)

(<wiktionary(英語)>κένταυροςの現代ギリシャ語と古典ギリシャ語の変化形)
https://en.wiktionary.org/wiki/κένταυρος

なんで、英語で、単数形が「centaur」なんて事になっているのか?というと、ギリシャ語は語尾変化を使って文章を記述する文法を使っているからで、その単語の語尾の区切り部分が、「centaur」だからです。
・<日本語>「ケンタウロス」(日本語には、男性名詞、女性名詞のような文法としての性というものが無いし、複数形もほとんど意識しないので、これ1つだけ)
英語のプロンプトの記述は、どうしたらいいのか?というと、おそらく、「centaur」だけ付ければよく、画像生成AIの種類で、その英語のプロンプト翻訳を日本語で記述する欄があった場合には、「ケンタウロス」でいいと思われる。(要するに、画像の「タグ」なので。複数形とか、男女の性とかあまり関係無い。一方で、イタリア語、フランス語、ドイツ語の現地の人が、画像に付けるタグには、普通に、文法上の男性形、女性形で書かれているはずです。ですから、プロンプトの記述で、今後、複数の外国語が対応して増えてきた時に、例えば、「フランス語の画像タグ」からプロンプトを探して入力しようと思ったら、きちんと、この単語の文法上の男性形、女性形を意識してプロンプトに入力しないと失敗するという時代に移っていくと思われる)

・(本来の予定の含めたかった要素)
『ケンタウロス少女』の形状にきちんとなる事。

・(実際の出力結果に含まれる要素)
画像生成AIの出力が極端に苦手な物である、「普通の形状をしていないもの」に「ケンタウロス」の形状があるが、やっと、『ケンタウロス少女』の形状で画像が出るプロンプトを発見した。ただ、まだ20枚に1枚位の頻度でしか出ない。『ケンタウロス少女』の形状で画像が出る事自体が珍しい事なので、作画崩壊していようが、『ケンタウロス少女』の形状で画像が出たら保存して、イラスト作成ソフトと、ケンタウロス形状部分のみを切り取るなどして、その画像を「構図」用として他の画像生成AIに持っていけば、きちんとした、ケンタウロス少女が完成するという段取りを使うしかない。ガチャが面倒な人は、ここにある、『ケンタウロス少女』の形状に近い画像を使って、「構図」用として他の画像生成AIに持っていくと楽と思われる。

・(出力後のイメージ雑感)(*普通に、画像生成AIは、人間がはじめに想定していたイメージとは違う画像を出力しやすい特徴があるので)
とりあえず、『ケンタウロス少女』の形状で画像が出るようにはなったので、自分の目標が、ケンタウロス少女だけを作る目標ではないためにいったん終了。
===========================
(ここから上は、「プロンプト」作成時のメモ書きデータ)

(ここから下は、「創作時のこのキャラクターの設定資料集」)
(*要するに、ここから下は、「創作者の著作者名表示」を入れた方がいい。要するに、「あなたがラノベ小説を書く」側になる場合には、あなたのペンネーム(小説ブログ系ならば、ブログのハンドルネームでいい)を書く。本名は基本的にネットに書かない方がいい))
見やすさで、「タグ」とか「脚注」がテンプレートの下に配置されている
===========================
(*注意事項)
(著作者名表示について)
「著作権は創作と同時に発生する権利です。したがって、権利の発生のために特許庁や文化庁等の行政機関に手続きをする必要がありません(自然発生権)」と書いてあるので、著作した瞬間に、「著作者名表示」というものを行う必要があるようです。
「著作権」は発生した瞬間に、原則的には、「著作者名表示」が必要となるので。

ですから、以下の自分が書いた「背景設定」、「ストーリー」を含めて使う場合のみ、「(C) tsundereloid」を含める必要があります。
一方で、【プロンプト付きのキャラクターカード】の中の背景設定無しの部分のみの利用の場合には、「(C) tsundereloid」を入れる必要はない。(というか、同じプロンプトを入力しても違う画像が出やすいので)
自分が作る小説や背景設定のお話を気に入ってくれて、その世界観を共有した「2次創作」文化を創りたい場合には、背景設定や、自分が書いた小説の一部を使って「2次創作」に使う時に、スタッフロールとかのどこかに、「(C) tsundereloid」を含める必要があり、それだけ守って貰えれば、自分は、商用利用の2次創作も含めて許可しています。
===========================
<このキャラクターを自分でネタに作る時の設定資料集、著作創作物の背景設定案(とかを書く項目欄)>
・(このストーリーや背景設定を著作した人の著作者名表示)(「(C) tsundereloid」のような感じで書く)
・(創作時に使うキャラクター名案)
・(創作時に使うこのキャラクターの主題コンセプト)(「Boy Meets Girlのシナリオのメインヒロインで主人公とずっと行動を共にし最後は結ばれる」とか「ラスボス」とかのキャラクターのメイン主題を書く場所)
・(キャラクター設定)(性格設定とか、細かい設定を書く場所)
・(背景設定)(ストーリーに直接現れる背景設定)
・(裏背景設定)(ストーリーに直接的には現れない背景設定だが、きちんと裏背景設定があって、物語に深みを与える間接的な背景設定。ストーリーライターの手法としては、「ストーリーとして直接、読者に詳しく全部説明してしまう」よりも、あえて、「裏背景設定」として隠しておいて、読者にいろいろと妄想させるように、読者を惹き込む小細工を周辺に散りばめておくだけにしておく。とか、少し「もやもや」の気持ちが残った方が、そのシーンは、いい感じになる事がある。他にも、例えば、「このキャラクターのモデルは友人なので、誕生日設定が一緒である」とかの「メタ」背景なんかが含まれる事もある)
・(裏背景設定(メタ背景))(「メタ」というのは、その作品中の世界観とは無関係な、いわゆる「現実世界の方の作者とかの話」とかの箇所)
・(シナリオのあらすじやプロット)
・(関連イメージボード絵とか)
・(関連人物相関図とか)
(ここに、自分が、いろいろとキャラの裏背景設定とかを書き込む事があるが、それは、当然、自分の著作物なので、自分に著作権があるので、この箇所の「背景設定」に書かれている箇所をそのまま利用したり、創作アイデアのネタ探しに部分的に使ったりするような「2次創作」を許可します。「2次創作」は、「他人の丸々コピー」もつまらないと思うので、独自に、どんどんアレンジしていいし、こちらに気を使って、「元ネタ」のイメージを崩さないように配慮する必要も無い。「創作」は、「自分の自由の羽」なので、自分の想い描くままに想像を膨らました方が楽しいです)
===========================
<備考欄>
・(法的備考欄)(このプロンプトに関連しそうな法律根拠など)
例えば、どう見ても、「ゴッホ風」のタッチになっているなどの時に、
・『フィンセント・ヴィレム・ファン・ゴッホ(オランダ語: Vincent Willem van Gogh、1853年3月30日 - 1890年7月29日)は、オランダのポスト印象派の画家。』
のように書いて、著作権が切れている期間に入っているのか?などを書いておく場所。
著作権保護期間は、国によって違うので、どの国の画家なのか?も書いておく。
プロンプトが英語か、アルファベット書きな事もあって、印象派とかの画家名は、きちんと、英語で書いておくと使いやすい。
===========================
<タグ欄>(主に、「ジャンル」タグとか)  #ファンタジー , #ケンタウロス , #少女
===========================
<脚注欄>(関連する参考資料とかのリンクと、もっと話にリアリティが出せる深掘りした話なんかを書く。例えば、「このキャラクターは猫を飼っている」という設定にして、実際に猫を買っている人のSNSとかで、「うちの猫がネズミ拾ってきた。猫は、飼い主に狩りの報告をわざわざ見せにくる習性があるから」とかいう話を見つけたら、根拠の参考資料として書いておくとかの使い方。実際のラノベ的な展開だと、「主人公の女の子の所に飼っている猫が捕ってきたネズミを見せにくる」というシーンの時に、「うげっ」とか書くようなシーンに使う。自分の場合には、ここに、関連エッセーとかを、たぶん大量に書く)
===========================
<サブ画像資料>
*画像生成AIの出力結果は、ブレが激しいので。また、「当たり」画像が出るまで、100枚とか出力を繰り返す必要があるので。「メイン画像」としては使わないものの、「雰囲気」、「光などの描写」、「何か偶然含まれた小物に興味がいった」とかのサブ画像資料保管庫とメモ書き。
(このプロンプトの目安画像集)(メイン画像の他に、良さそうなのがある場合には、5~10枚とか参考資料に使いたい画像を置く)

===========================
・(イメージに近づけるようにプロンプトを改良したVer.2とかのリンクを置く場所)
===========================
・(改良する前のさらに古い元Ver.のリンクを置く場所)(「キャラ案元Ver.リンク」が、1番上側にあった方が見やすいかも)
===========================

<『創作の庭』用【プロンプト付きキャラクターカード】の使い方は次の記事に書いてあります>


この記事が気に入ったらサポートをしてみませんか?