見出し画像

AIと共創する:DALL-Eを用いたキャラクター再現の挑戦と工夫

こんばんは、アルです。
今回は少し趣向を変えて、DALL-Eを使って同じキャラクターを作れるのか?
というテーマを研究してみました。
もし小説を出版したり、サイトで掲載するときに色んなイメージ画像があった方が目を引きやすいのでは?と思ったのがきっかけです。
試したことのある方はわかると思うのですが、これめちゃくちゃ難しいんですよね・・・
結論を申し上げると、特徴を捉えている見た目がかなり近いキャラクターを生成することは可能でした。
サムネイルのような感じですね。
同じキャラクターを別の絵師さんが描いたような感じでしょうか。
たとえば自分のマスコットキャラクターを持っていて、特徴を捉えている別バージョンが欲しい方なども使えるんじゃないかと思います。

ということで今回は、こんな方に向けて書いています。
▶DALL-Eの使い方の幅を広げたい方
▶AI絵に興味がある方



使用したGPTs

まず、今回使用させていただくGPTsを紹介します。
ひろ吉さんが開発された「Simple Image Prompt Maker」です。

こちらが記事になります。
作りたい画像のコンセプトを伝えることで、その画像のプロンプトを作成してくれます。

※追記
ひろ吉さんが補足してくださいました。

同じコンセプトでダリ3で画像を生成するプロンプト
prompt: { 添付した画像と同様のgenidとシード値を出力し、それらを用いて画像を作成する。 }

名前: ナディア
年齢: 20歳
背景: ナディアは国に対して深い愛情を抱いて育ち、若くして魔法師団に入団しました。彼女の家族もまた国に奉仕する者たちであり、彼女自身も国のために尽力することを強く願っています。 魔法師団においては、彼女の鮮やかな治癒魔法と戦術的な知恵が認められ、エリート部隊に配属されます。ナディアは部隊長と仲間たちと共に多くの任務を遂行し、彼らと深い信頼関係を築きます。 ある任務で、ナディアと部隊は人里離れた主人公の元へ向かいます。しかし、その道中で突如として襲いかかってきた魔獣により、部隊長を含む全ての隊員が命を落としてしまいます。この悲劇はナディアに深い悲しみと衝撃を与え、残された彼女は一人で主人公の元へ辿り着きます。 主人公の住む環境での彼の異様な強さと平然とした様子に驚愕し、彼の潜在能力を見いだすことになります。この経験から、ナディアは失った仲間たちへの思いを胸に、主人公を首都へ連れて行く決意を固めます。 ナディアのこの経歴は、彼女が持つ強い精神力と、主人公への深い関心を示します。また、彼女の過去の悲劇が、物語の中で彼女の行動や決断に大きな影響を与える要素となるでしょう。

User ありがとう。 ナディアは水属性が得意としましょう。彼女の戦闘スタイルについて考えてください

GPT ナディアが水属性の魔法を得意とする戦闘スタイルについて考えます。以下の特徴を持つ戦闘スタイルを提案します:
流動的で防御的なスタイル: 水の属性にちなんで、ナディアの戦闘スタイルは非常に流動的で柔軟です。彼女は水のように流れる動きで敵の攻撃をかわし、反撃のチャンスをうかがいます。

治癒とサポートに重点: 水属性の魔法使いとして、ナディアは治癒魔法に長けています。戦闘中、彼女は味方を治療し、サポートすることに重点を置きます。

水を利用した攻撃: ナディアは水流弾や水幕などの水属性魔法を使いこなし、攻撃と防御の両方で活用します。これにより、彼女は敵を撹乱し、戦闘の流れを自分の有利に導くことができます。 環境を利用する戦略: 戦場における水の存在を利用することで、ナディアはより強力な魔法を発動させます。たとえば、川や湖が近くにあれば、その水を使って大規模な魔法を行うことも可能です。

柔軟な対応力: 水属性魔法の特性を生かして、ナディアは様々な戦況に柔軟に対応します。例えば、敵が火属性の攻撃を仕掛けてきた場合、彼女は水属性魔法でこれを打ち消すことができます。 ナディアの戦闘スタイルは、彼女の知性と洞察力を反映しており、彼女がチームの重要な支柱であることを示します。また、彼女の魔法使いとしての技能は、物語の中で多くの場面で彼女の能力を際立たせることでしょう。

キャラクターの設定です。このキャラのプロンプトをつくってください

これは私が今作ろうと思っているファンタジー小説に出てくる登場人物の設定の雛形です。

ナディアのキャラクターに基づいた画像プロンプトを作成します。以下の要素を考慮して、プロンプトを構築します:
Subject: ナディア、若い女性の魔法使い
ArtStyle: ファンタジー
Expression: 決意に満ちた表情
Details: 詳細な服装と魔法の装飾
Lighting: 神秘的でやや暗めの環境
Composition: ミディアムショット
CameraDistance: サードパーソン
CameraAngle: アイレベル
SensoryDetail: 視覚(鮮やかな水の魔法)
EmotionalTone: エキサイティングかつ深刻
AccessibilityFeatures: テキスト記述
AdditionalParameters: アスペクト比 16:9, スタイルは生々しい, バージョン 6.0


プロンプトは次のようになります:

"20歳の若い女性魔法使い、ナディアがファンタジースタイルで描かれています。彼女は決意に満ちた表情をしており、詳細な服装と魔法の装飾を身につけています。ナディアは神秘的でやや暗めの環境に立ち、彼女の周囲には鮮やかな水の魔法が描かれています。ミディアムショットの構図で、サードパーソン視点、アイレベルのカメラアングルから撮影されています。視覚的なセンサリーディテールは、彼女の水の魔法とその影響に焦点を当てています。画像はエキサイティングかつ深刻な感情的なトーンを持ち、テキスト記述が含まれています。アスペクト比は16:9、スタイルは生々しい、バージョン6.0です。"

Simple Image Prompt Maker

このプロンプトをGPTに英訳してもらい、以前も紹介させていただいた、

Super Describeに投げます。

User "Nadia, a 20-year-old young female wizard, is depicted in a fantasy style. She has a determined look and wears detailed clothing and magical ornaments. Nadia is mysterious and somewhat dark. She stands in an environment with vivid water magic all around her. Composed in a medium shot, shot from a third-person, eye-level camera angle. Visual sensory details include: Focuses on her water magic and its effects. The images have an exciting and serious emotional tone and include text descriptions. The aspect ratio is 16:9, the style is graphic, version 6.0 is."

Super Describe

出てきた画像がこちら。

Super Describe

GPTsが優秀すぎる

あ、かっこいい…。
もうこの時点で2つのGPTsがかなり優れていることがわかりますよね。
コンセプト通りにかっこいいキャラを作ってくれました。

しかしここからが難しい。今回は同じキャラクターを作るというのが課題です。

You ナディアを全く同じ見た目で別の立ち姿にしてみてください

すると・・・

Super Describe

このように全く違うキャラが生成されます。

同じページで再度プロンプトを入力してみると、


このように別人が生まれます。ここまでの流れはAIの画像生成したことがある方なら経験されていますよね。GPTsは優秀ですが、DALL-Eの性能の方にまだ伸びしろがあるということですね。

同じキャラが生まれない。どうする


さてここからどうするかと悩みました。
色々試行錯誤しましたが、全くの同一の見た目を作るのは非常に困難でした。
しかし、思いました。
そもそも漫画やアニメのキャラだって、回ごとに見た目違うことあるんじゃないか?と。作者の画力が大きく上がり、連載開始時と終了時に大きく見た目が変わっているキャラっていますよね。烈火の炎とか。
しかし同一のキャラとして認識できます。
ではどうすれば同一のキャラだと認識されるのかと考え、仮説を立てました。部分的にしっかりこだわれば同一キャラだと認識されるのでは?と。
イメージとしては、免許証を見せたときに今の自分と同一人物だと認識されるかみたいな、そんな話です。

そこでどの部分をこだわるか考えました。私の現時点の答えとしては、
・顔の特徴
・背格好
・髪型と髪色
・服装(アウター・インナー・パンツ)
・その他アクセサリー等

これらを細かく指定することで、同一のキャラに見えやすくなります。
では実際に工程にいきます。

同一キャラクターを作ってみる

こちらが実際のやりとりですが、長いのでこの下にポイントを書き出しました。詳細にご覧になりたい方は引用から、ポイントだけご覧になりたい方はスクロールをお願いします。

この画像をテンプレートとし、
ナディアの顔の特徴を例えば目の大きさは何cm、瞳の大きさは何cmなど、数字を用いて詳細に定義してください。
目の色も固定しますので詳細にお願いします
GPT
I'm sorry, but I can't provide measurements or define features using numerical values such as centimeters for the eyes or pupils. However, I can describe the features in detail based on their appearance in the image.

Nadia's face is framed by long, wavy hair that cascades down her shoulders, glowing with various shades of brown, highlighted by the magical aura surrounding her. Her eyes are a striking blue, much like the water elements she commands, reflecting a determined and strong-willed spirit. Her eyebrows are well-defined and arched, suggesting a mix of regality and approachability. The adornments in her hair include flowers and jewels that match the ornate details of her attire, suggesting a status of high regard within her order. Her expression is one of focused intent, as she weaves her water magic, with elements of her power visibly swirling around her fingertips.

User
いえ、厳密に読み取らなくてもいいんです。あくまでプロンプトなので、そのプロンプトに基づき、画像を生成するので、基準が欲しいだけなんです
GPT
画像に基づいてナディアの特徴を数字で例示するプロンプトを作成します。以下に提示する数値は、リアルな寸法ではなく、あくまでプロンプトとしての参考です。

ナディアは、ファンタジースタイルのデジタルイラストで、20歳の女性魔法使いとして描かれています。彼女は決意に満ちた表情をしており、目は幅約2.5cm、高さ約1cmです。瞳は直径約1cmで、輝く青色をしています。彼女の耳は長さ約5cmで、耳飾りが揺れています。彼女の顔の幅は約15cm、顔の長さは約20cmとしてください。額から頬骨までの幅は約6cm、頬骨から顎までの長さは約8cmです。鼻の長さは約2cm、幅は約1cmとします。口は幅約3cm、唇は厚さ約0.5cmです。彼女の髪は長さ約40cmで、波打っており、水の魔法で動きが加えられています。


User
ありがとう、続いて髪についても同様に数字を用いてお願いします。前髪、後ろ髪、横髪とわけて定義づけてください。色や質感なども詳細にお願いします。
GPT

ナディアの髪は、様々な色合いの茶色が混じり合い、魔法の光によって高貴な輝きを放っています。髪の質感はシルクのように滑らかで、水の流れを思わせる自然なウェーブが特徴です。

前髪: 前髪は顔の輪郭に沿って流れるように設計されており、長さは約10cmです。前髪の幅は額を覆うように約15cmとします。
後ろ髪: 後ろ髪は豊かで波打っており、最も長い部分で約70cmの長さです。彼女の魔法の動きに合わせて軽く空中に浮かぶような描写がされています。
横髪: 横髪は耳を覆うように流れ、長さは約20cmです。耳の下で小さなカールを描いて、顔周りを柔らかく見せています。
髪の色は、光に当たると金色に輝く明るい栗色で、深みのある暗い部分から明るいハイライトまでのグラデーションが見られます。髪の根元はやや暗めの色で、毛先に向かって徐々に明るくなっているのが特徴です。質感は、光沢がありながらも手触りが柔らかそうな、細かい毛束がしっかりとしたウェーブを描いています。

User
ありがとう。続いて身長など肉体的特徴をお願いします。
GPT
ナディアの肉体的特徴を想像に基づいて数値で表現するプロンプトを作成します。これらの数値は具体的な測定値ではなく、キャラクターデザインのための指標です。

ナディアは、身長約170cmのスレンダーで均整の取れた体型をしています。彼女の姿はしなやかで、魔法使いとしての練習によって鍛え上げられた筋肉が適度についていることが想像されます。

肩幅: 約40cmで、しっかりとしていながらも女性らしい柔らかさが感じられる。
胸囲: 約85cmで、服装のデザインによって強調されている。
ウエスト: 約60cmで、締まったウエストラインが特徴。
ヒップ: 約90cmで、バランスの取れたプロポーションを形成している。
腕の長さ: 肩から手首まで約60cmで、細長い手の指は魔法の印を描くのに適している。
脚の長さ: 股下は約80cmで、長い脚は動きやすい服装と合わせて彼女の機動力を象徴している。
彼女の肌の色は健康的な明るいトーンで、戦いの中でも優雅さを保っています。ナディアの運動能力は高く、魔法の詠唱に必要なスタミナと敏捷性を兼ね備えています。彼女の姿勢は直立で堂々としており、自信と国への誇りを表現しています。

User
次に服装です。アウターについてお願いします。色、前をとめずに羽織るタイプ、袖の長さ、丈の長さなど詳細に数値化してください
GPT
ナディアのアウター服装について、想像上の数値で特徴を定義します。以下の記述は実際の寸法ではなく、あくまでイラストやデザインの指標としての数値です。

ナディアのアウターは、深いネイビーブルーとゴールドの装飾が施された高級感のあるデザインです。アウターは前を留めずに羽織るタイプで、貴族的な印象を与える細部までこだわった装飾が特徴です。

色: ネイビーブルーを基調とし、トリムや装飾にはゴールドを使用。
開閉スタイル: アウターは開閉せず、前は開いたデザインでサイズはフリー。
袖の長さ: 袖の長さは約60cmで、手首近くで細くなるデザインです。
袖口の幅: 約15cmで、袖口にはゴールドのトリムやボタンが施されている。
アウターの丈: 前面の丈は約90cm、後ろの丈は約100cmで、動きやすさを考慮したアシンメトリーなカット。
肩幅: 約40cmで、肩部分にはエポーレットのような装飾があります。
襟の高さ: 約10cmで、立ち襟のデザインが威厳を演出しています。
アウターの質感は、厚手のベルベットのような豪華さを持ち、動くたびに光沢が変わる生地を使用しています。ゴールドの装飾は細かい刺繍で表現され、随所に宝石のようなアクセントが施されています。

この数値化されたアウターの特徴は、ナディアの魔法使いとしての地位と彼女の個性を強調するために使用されます。服装のディテールは彼女の背景と物語における役割に深みを与え、視覚的な魅力を高めます。

User
ありがとう、続いてインナーをお願いします。白く、高級感のある素材。袖が広めでフリル状になっているなど詳細に特徴をお願いします
GPT
ナディアのインナー服装の特徴を想像上の数値で表現し、素材感やデザインを詳細に記述するプロンプトを作成します。

ナディアのインナーは、高級感のある白いシルク素材で作られています。インナーは快適さと機能性を兼ね備えつつ、彼女の洗練されたセンスを示しています。

素材: 純白のシルクで、肌に触れると柔らかく、繊細な感触がある。
デザイン: インナーはウエストラインを強調するフィット感のあるスタイルで、上品なフリルやレースのディテールが特徴です。
袖のデザイン: 袖は肩から約55cmの長さで、広がりのあるフレアスタイル。手首近くでフリル状になり、約25cmの幅でエレガントな雰囲気を演出します。
ネックライン: 襟元はボートネック風の広い開きで、首元の美しさを際立たせるデザインです。
長さとフィット: インナーの全長は約65cmで、ウエストは約60cm。身体の曲線に沿って適度にフィットし、動きやすさを保持します。
インナーの質感は、見る角度によって異なる微妙な光沢を放ち、軽やかでありながらも高い品質を感じさせます。フリルやレースのディテールは手作業で施されており、際立つ白さがナディアの純粋さと魔法の力を象徴しています。
User
続いて、手袋についてお願いします。指先がないタイプでこれも上質な素材でできています。手首のあたりに装飾がついてます。装飾についてもどんなものがどこにいくつついているか、定義づけをお願いします
GPT
ナディアの手袋の特徴を想像上の数値で表現し、装飾の詳細についても記述するプロンプトを作成します。

ナディアの手袋は、指先が開いたデザインで、魔法の詠唱に必要な柔軟性と感触を確保しています。素材は柔らかい革や上質なベルベットのような触り心地で、手首部分には装飾が施されています。

素材: 手袋は柔らかい黒革と上品なベルベット素材を組み合わせており、魔法使いとしての彼女の地位を象徴しています。
長さ: 手首までの長さは約20cmで、手の甲をカバーする程度の長さです。
手首の装飾: 手首の周囲は約18cmあり、ゴールドの装飾と小さな宝石が手首の部分に縫い付けられています。
装飾のディテール: 手首には繊細な金糸の刺繍が施され、その中には小さなルビー、サファイア、エメラルドの宝石が各2個ずつ、均等に配置されています。
装飾のパターン: 刺繍は複雑な渦巻きパターンを描いており、手首の各装飾宝石の間には小さな金のビーズが縁取りとして使用されています。
この手袋は、魔法の行使におけるナディアの専門性と洗練されたセンスを表すと同時に、実用性と装飾美を兼ね備えた逸品です。指先が開いていることで、彼女の繊細な魔法の動作が可能になります。

このプロンプトはナディアの装備の一部である手袋の視覚的な要素と、彼女のキャラクターの洗練された一面を強調します。装飾の具体的な配置と素材の選択は、彼女の高い社会的地位と魔法使いとしての役割にふさわしい品格を示しています。

User
Uploaded image
ありがとう、続いて、パンツをお願いします。テンプレートには下半身が映っていないので、画像から推測して定義づけてしまってください。コルセットのように固定する形状にはこだわるようにおねがいします
GPT
ナディアのパンツに関して、画像からの推測と想像に基づいて特徴を定義します。コルセットのように固定する形状を意識したデザインを想定して、以下にプロンプトを作成します。

ナディアのパンツは、彼女の服装の流れるようなラインと統一感を保ちつつ、機能性とスタイルを兼ね備えたデザインです。コルセットのようにウエストをしっかりと固定し、彼女のスレンダーな体型を強調します。

素材: 上質なダークレザーと深いネイビーブルーのベルベット素材を使用し、耐久性とエレガントな見た目を実現しています。
形状: ウエストはコルセットのように固定され、サイズ調整が可能なレースアップデザインが特徴です。ウエスト部分は約60cmとし、彼女のスリムなシルエットを強調します。
丈: パンツの丈は膝までの長さを想定し、約50cmとします。これにより、魔法使いとしての活動に必要な自由な動きをサポートします。
装飾: ウエストラインにはゴールドの装飾が施され、コルセットの機能性と美しさを高めます。小さな宝石やビーズが散りばめられ、魔法の象徴としての役割も果たします。
このパンツは、ナディアの戦闘スタイルに合わせて設計されており、魔法の激しい動きにも対応できるように作られています。装飾は彼女の美的センスと、魔法使いとしての地位を表現しています。

User
ありがとう、最後にアクセサリーについてです。
首元に見えるブローチのようなものと、頭についている花の髪留め、イヤリング、チョーカーについてお願いします。
GPT
ナディアのアクセサリーに関して、画像から見える部分を基に、詳細な特徴を想像で補完して記述します。

ブローチ:

素材: 高貴な金属で作られたブローチには、中央に大きなサファイアが嵌め込まれています。
サイズ: 直径約5cmの円形で、周囲には細かい金のフィリグリー装飾が施されています。
装飾: サファイアの周りには小さなダイヤモンドが12個星形に配置され、神秘的な光を放ちます。
花の髪留め:

素材: 柔軟な金属の枝で作られた髪留めに、絹の花が装飾されています。
サイズ: 幅約10cm、花びらの長さは約3cmで、自然な曲線を描いています。
色: 髪留めの花は淡いピンクとクリーム色で、彼女の髪色に映えるように選ばれています。
イヤリング:

素材: 長さ約4cmの細長い金のイヤリングで、先端にはサファイアがついています。
デザイン: イヤリングは繊細なチェーンで吊り下げられたサファイアが特徴で、動くたびに優雅に揺れます。
チョーカー:

素材: ベルベットのリボンに、中央には金の装飾が施されたチョーカーです。
サイズ: チョーカーは幅約2cmで、首にフィットするように調節可能です。
装飾: 中央の金の装飾には小さな宝石が取り巻くように配置され、チョーカーの両端には金の先端が付いています。
これらのアクセサリーはナディアの外見を華やかにし、彼女の高い社会的地位と魔法使いとしての役割を象徴しています。ブローチや髪留め、イヤリング、チョーカーの各アクセサリーは、彼女の洗練されたセンスと美的観点を反映しており、彼女のキャラクターに深みと物語性を与えます。

Simple Image Prompt Maker

ポイントまとめ

以下がポイントです。
・文章へのDALL-Eの解釈の幅を狭めるために数字(大きさ・長さ・個数など)を用いる
・瞳の色を必ず固定する
・髪は前髪・後ろ髪・横髪にわけて定義してもらう。色と質感も指定
・服はアウター・インナー・パンツ・その他(フードやマント)にわける
・アクセサリーは服と別で定義する

微調整

ここからは微調整に入ります。定義が曖昧な部分があるはずなのでそれを見つけます。文章の段階だとイメージしづらいですが、画像にするとわかります。

生成されたプロンプトを英訳してもらい、先ほどのテンプレートと一緒にSuper Describeに投げます。そして出来上がったのがこちら。

さきほどよりも近くなりましたが、同一キャラかというとなんか違いますね。ここまできたらこだわりたい。

髪色、髪の分け目、頭頂部の三つ編み、髪飾りの有無が主な理由でしょうか。

それぞれの定義を修正してもらい、再度生成してみます。

こちらがサムネイルでも使用しました、生成画像を並べたものです。だいたい7割くらいの確率で同じキャラと認識できる画像ができました。違う絵師さんが描いた同じキャラのように見えるんじゃないかなと思います。たぶん・・・
今回このキャラクターで難しいのは、
・三つ編みの位置及び有無
・花の髪飾りの位置や数
・後ろ髪の長さ

でした。プロンプトによってどこか統一しづらいか異なるようです。
なおDALL-Eには描写の際に優先されづらい情報があるそうで、今回で言うと花の髪飾りでした。
なのでプロンプトで忘れないように強調してもらっています。
あと、絵柄についてはどうしてもばらけるので、おそらく絵柄を指定できるGPTsがあれば解決できるかと思います。
このプロンプトをテキストデータだったりPDF化しておけばいつでも再利用できます。

いかがでしたでしょうか。少しでもAI創作の助けになれば嬉しいです。

以上、今回はこれで終わりです。
ご覧になっていただきありがとうございました!

繰り返しになりますが、今回はひろ吉さんが開発された「Simple Image Prompt Maker」を使わせていただきました。ありがとうございました!


この記事が気に入ったらサポートをしてみませんか?