見出し画像

Chat GPT dalle3で同じ絵柄でイラストを生成するテクニック

どうも、ずずずと言います。
はじめましての方もそうでない方も、よろしくですー
毎日AIイラスト錬成でレッツエンジョイ!、主にXで活動しています。


<はじめに>

早速ですが今回はタイトルの通り、同じ絵柄でイラストを生成する方法についてです。
主に初心者、中級者に入るかなという方向けにと思って書いています。

まずdalle3というのはOpen AIのChat GPT、Micro softのCopilotで使用できる画像生成ツールになります。
dalle3で生成された方なら経験されたことかと思います、dalle3というAI生成ツールは日本語対応で使い方も難しくもなく非常に簡単に画像生成ができます。
ところが簡単にできるがゆえに出来上がる画像のランダム性がどうしても出てきます。

例えば『フラット、シンプル、ステンシルステッカーイラスト、緑色の長いポニーテールの髪、緑の目、女の子』でプロンプト(AIに対する指示)を入力すると下記のように画像が生成されます。

こんな感じで出力されるんですが、いかがでしょうか?
絵柄が似ていたり、バラバラだったりしています。
ここから気に入ったものを選んだりするのですが、以前にも記事を書いたLINEスタンプ、アイコン集などを作りたいとなってくると統一した同じ絵柄を出てくるまで何種類も何回もするの大変です。

ChatGPT 、Copilot(Copilot無料版は商用利用不可と考えておいてください)はそれぞれ1日に生成できる画像の制限があります。
それでは長い時間を要することになるので、どうにかして同じ絵柄で生成できないかという壁に当たることになります。゚(゚´Д`゚)゚。

そこで今回はChatGPT dalle3での日頃生成してきた経験と検証した結果の方法を紹介していきます。
参考にこのような感じで生成できます。

<今までの経験による仮説>

ここからは私が考える仮説を記します、真偽は定かではないです。
まずdalle3はモデルの概念がないです、別の有名なAI画像生成ツールSD(ステーブルデュフージョン)はまずモデル(画像学習ファイルのような物)を設定してから生成するので絵柄が大体同じようなテイストになります。
参考に下記に添付します。

SD系の生成画面になります
赤の部分がモデルファイル
このようにモデルがたくさんあり、核となるファイルになります
選んで生成する形になります

仮説1.プロンプトは詳細に記載する方が統一性が出やすい

当たり前のことじゃないかと思いますが、これはとても大事です。
ここで問題となる絵柄は私たち使用者が指示をしてあげなくてはなりません、先ほど上記で挙げた『フラット、シンプル、ステンシルステッカーイラスト、緑色の長いポニーテールの髪、緑の目、女の子』が指示に当たります。

「でもこれじゃあ、絵柄がバラバラだったよ?」て思いますよね?

そうなんです、絵柄を安定させるには上記のプロンプトじゃあ足りないんです、もっと詳細な説明をしてあげた方が統一されます。
これはほぼ間違いないと思っています、上記だと人物の容姿について情報が不足しておりAIからすると範囲が広いためブレやすいです。

仮説2.トークン数並びにプロンプトの順番が関係しているのではないか?

SD系では75トークンの縛りが以前ありました、現在ではもっと多くなっているようです。
トークンというのはわかりやすくいうと意味のある単語です、例えば男の子、女の子、黒、白などの単語が1トークンとなるとします、75トークンを1グループとして前にある単語ほど強く影響し後に行くほど弱くなります、その後76トークン目に行くと強くなります(2グループ目の先頭のため)。

以前あった75トークンの縛りの例

highres, highest quallity, illustration, ultra detailed, (detailed face), (detailed eyes), (detailed shiny hair),cinematic lighting, best quality, hyper detailed, masterpiece,⇦例えばここが75トークン

76トークン⇨1girl, solo, grey eyes, short hair, multicolour hair, asymmetrical hair, belt, jacket, off shoulder, bodysuit, detached sleeves, hip vent, luminous eyes, medium breasts, (colorful), upper body, from above, sitting, looking at viewer, indoors, inside a spaceship, futuristic, window

上記でいくとmasterpieceが75トークン目になるので効果が弱くなります。次の76トークン目の1girlは効果が強くなります

簡単に説明するとこんな感じになりますが厳密にはもっと詳細な内容になるため今回は割愛します、知りたい人は検索掛ければ出てきます!
またプロンプトの組み方によっては絵柄がガラッと変わる可能性があると思います、少しプロンプトを入れ替えたりすると違うものになったりしたことがあります。
順番と種類は大きく影響する要素だと考えます。

以上2点の仮説を立てつつ絵柄の安定化目指します。

<安定化の方法について>

方法ですが今回はGPTsは使いません。
GPTsとは、ChatGPTをカスタマイズできる機能です。GPTsを使用することによって、オリジナルのチャットボットを作ることができます。
一定のタスクや処理を自動化することができていろいろな作業効率を上げることができます。
GPTsの方法についてはいろんな方が出しているので違う方法でやってみます、理由は初心者の方がGPTs作るってなると億劫でとっつきにくだろうなと考えたためです。
今回は3パターン考えたのでそれぞれ紹介したいと思います。
内容で言うと1を軸とした2、3は応用発展型になります。(打率は低いものもあります)

そして今回の記事の趣旨は有効なプロンプトの指示の方法、jsonを活用して画像生成に対するアプローチの仕方、考え方について重きを置いています。
この記事を読んでいただいた方には一歩深いところでChat gptで扱うことができるようになると思い、約5カ月使用して気づいたことを書いています。
以下の注意に目を通した上で興味ある方は是非読んで頂きたく思います。

購入して読んでいただきたい方は
1.dalle3を研究してうまく使いたいと思う方
2.探究心の強い方
3.プロンプトを有効的に指示できるようになりたい方
4.絵柄を固定して出すコツを勉強したい方

購入をやめた方がいいと思う方は
1.ボタン一つで超簡単に生成したい方
2.探究心がない方
3.大体で画像生成できたらいいと思う方
4.あまりGPT に興味ない方

注意
100%ではないのでその点はご理解ください
これらのを踏まえた上で購入をご検討のほど、よろしくお願いします。

5/1追記
絵柄の固定法を使うと塗り絵のバリエーションを作るのも統一感を持って作成することができます。

背景込みでのイラストでは以下のように生成することができます。

5/15追記
GPTのアップデートによりGPT-4oがリリースされ、機能が追加されています。
以下のように2枚の画像を合わせて、画像を生成する機能があります。
使ってみた内容を追記しました。

ここから先は

33,383字 / 48画像

¥ 3,000

この記事が気に入ったらサポートをしてみませんか?