見出し画像

AIアート上達の近

AIアートはプロンプトと言われる「言葉で絵を描く」のですが、このプロンプトを苦手とする人も大勢いると思います。確かに世の中には滅茶苦茶な文法のプロンプトも沢山あって、それを見てしまうと「これはわからんわ!」と思ってしまうと思いますが、理路整然としたプロンプトを書くのは本当に難しいものですね。

でも実はまとまりのあるキレイなプロンプトを書くためには、ある能力が必要なんです。

AIアートがそれなりに描ける人は皆「絵を見たらプロンプトがわかるし、プロンプトを見たら絵がわかる」という能力を持っています。

これは特別な才能がある人だけができる特殊なことではありません。訓練すれば誰だってできることです。

この能力を鍛えれば綺麗なプロンプトを書くことも難しくはありません。

たとえばこの画像を言葉にしてみましょう。

「1つの赤いリンゴ」ですね。

「写真画質」で、「背景は白」です。

ではこちらは?

写真画質で青りんごです。背景は黒です。


これらの絵はとてもシンプルな「主題」と「背景」の2つの構造の絵になります。

絵は大体「主に描きたいもの」と「それ以外」と「背景」に分かれますがこのリンゴの絵のように2つの構造だけのものは比較的わかりやすく、誰が見ても間違えずに「メインで描かれているのはリンゴ、背景の色は白」と答えることができます。

絵が単純だと誰でもわかることですね。

でも絵が複雑になるとこんな風にバラバラに要素を分けて考えることができなくなってしまいますが複雑になってもやることは一緒なんです 

「絵を見たらプロンプトがわかる、プロンプトを見れば絵がわかる」という能力のある人はこのような作業を頭の中で常にやっているんです。


これを少しずつ難しくしていってみましょう。

photograph. 3 Apples, white background.

リンゴが3個に増えています。だから「写真、3つのリンゴ、白背景」ですね。

Design. Rainbow colored apples.

これは虹色にしてみました。

Photo: A small wilted apple.

しおれたリンゴです。

こんな風に描きたいものを言葉で指定すれば絵は変わります。

文法上は「画像の種類、主題、背景」の順に記述しています。

でもリンゴだけじゃ物足りないので他のものも描いてみましょうか。

photograph. Apples. Fork. Paper napkin.white background.

ここに描かれているのはリンゴとフォークとペーパーナプキンです。


さらに増やしてみましょう。

photograph. Apples. Fork. Paper napkin.wine glass. table. White Rabbit. Windows, lace curtains. blue sky.

これは「写真。 りんご。 フォーク。 紙ナプキン、ワイングラス。 テーブル。  白いうさぎ。 窓、レースのカーテン。 青空。」ですね。

背景も白背景以外にしてみると一気に絵が複雑になりますね。

どんなに描かれるものが増えたとしても、1つ1つを丁寧に言葉にしていけば絵とプロンプトは対応しているのできちんと描けます。

そして「見たものをそのまま言葉にしただけのプロンプト」は決してグチャグチャではないんですね。グチャグチャなプロンプトというのは語順がグチャグチャになっていたりして、「反映していない単語」が入っているものです。そうすると描いてほしいものではないものをAIが勝手に描いてしまうこともあります。

絵を描いたときは指定した単語がきちんと絵に反映されているかを確認しながら修正していきましょう。


これまでは写真の画像でやってきましたが、画風を変えてみましょう。


watercolor apple.

写真から絵にしてみました。水彩画です。
この場合のプロンプトは「watercolor apple.」です。
大抵の絵は「写真かそれ以外の絵か」の2つに大きく分けられます。2Dか3Dかという分け方もできますが絵の3Dもあります。写真以外の絵というのはいろいろと種類があるのでその呼び方を覚えておくと描きやすくなります。

これを油絵にしてみましょうか。

Oil painting, apple.

点描画。

Pointillism. Apple.

ボールペン画。

Ballpoint pen drawing. Apple.

切り絵。

Paper-cutting art. Apple.

コラージュ。

collage. Apple.

ポップアート。

pop art. Apple.

家紋。

Family crest. Apple.

子供が描いた絵。

A picture drawn with crayons by a 3 year old child. Apple.

インスタレーション。

installation. Apple.

窓ガラスの結露に描いた絵。

A picture drawn with a finger on a glass covered with condensation. apple.

ピクトグラム。

Pictogram. apple.

こうやって並べてみるとかなり違いがありますね。
画風の違いは絵を大きく変えてくれます。


絵を構成する要素はいろいろあります。
今並べた絵のキーワードは「美学、ジャンル、媒体」に入るものですね。他にもいろいろな言葉を組み合わせてやると、絵柄をコントロールすることができます。

・2D/3D
・写真か絵か
・美学、ジャンル、媒体
・色(配色、色相、彩度、明度)
・線、輪郭、ブラシワーク、影
・素材、質感、模様、形状、図形
・印象、感情、ストーリー性
・天気、場所
・ディティール、クオリティ、コントラスト、調和
・構図、ポーズ、カメラアングル、フォーカス、ライティング
・余白
・画像比率


ただし全部言葉で描いていると文字数オーバーしてしまうので、「人名」という形でスタイルを指定することができます。

Henri Lebasque. apple
alessandro gottardo. apple
kyffin williams. apple

ですが、思ったような絵を描こうとしたときに人名だけではカバーできないこともあります。

その時必要になってくるのが「絵画に関する単語」です。

たとえば私が「白黒」の絵を描く時これらのフレーズを使い分けています。

inverted black and white
expressive black and white
black and white mastery
black-and-white graphic
trace monotone
black and white grayscale
Monochrome art with tremendous detail
intricate black and white illustrations
Black and white line drawing
detailed monochrome
stark black and white
monochromatic minimalist portraits

なぜ使い分けるかというと、ほかの単語との相性があるからです。

元々のプロンプトにどんなワードを組み合わせるときちんと絵に反映されるかはテストしてみないとわかりません。AIアートが難しくなってくるのはこのようなワードを使い始めたころからだと思います。これらはいわゆる「呪文」などと言われるようなものだと思います。だけど呪文をコレクションしても良い絵は描けません。

なぜなら、AIアートで最も重要なのは「主語」だからです。呪文にこだわる人は主語の装飾の概念がどれほど大事なのかを忘れがちです。

AIアートの場合、「こんな絵を描いてください」とAIに言葉でお願いをするわけですから具体的に「女の子を描いてください」と言っても「どんな女の子なのか」をきちんと指示しなければ上手く描いてはくれません。それと同じで船を描かせても城を描かせても猫を描かせても「どんな」の部分が最も重要で、この「主語の装飾」をどれだけ正確に記述できたかが「良い絵を描けたか」につながります。

この「どんな」の部分こそが先程練習した「絵を見たらプロンプトがわかる、プロンプトを見たら絵がわかる」という能力を必要とするんです。

あなたの中にあるイメージを言葉にするには、この作業が得意な人ほど簡単なんです。

リンゴの場合だと、

「腐ったリンゴ」というとこのようにリンゴの形状が変わります。

A rotting apple.

「ナイフで半分に切られたリンゴ」というとこうなります。

An apple cut in half with a knife.

顔をペンで描いたリンゴ。

An apple with a designated face doodle with a pen.


画風も絵を大きく変化させますが、「主語の装飾」も絵を大きく変えます。

主語を装飾するのは主に形容詞ですがそれ以外にも「主語のジャンル」などによって変化します。

例えばこれは「リンゴのぬいぐるみ」です。リンゴが変化したというよりはリンゴ自体のジャンルが変化していますね。

A stuffed animal in the shape of an apple.

今度はステッカーにしてみましょう。

A sticker with an apple picture.

ジャンルが変わると絵も変わりますよね。

ですが一番絵を作り上げる威力があるのが「主語と動詞」の関係です。

「少女」というとAIは単に女の子を描いてくるだけです。

Girl.

「少女が立っている」と指示をしてもこのようになります。

Girl.She is a girl standing.

これを「女の子がジャンプしている」とか「女の子が笛を吹いている」というと絵は大きく変わります。

The girl is jumping.
The girl has many apples.

動詞の力は強いですね。

英語を習うときに、「主にS(主語)、V(動詞)、O(目的語)、C(補語)の4要素からなる語順のルール」というのがありました。

これはAIアートにおいてもとても重要で、この語順をきちんと記述しておくと正しく絵に反映されやすいです。

手足を大きく動かすような動詞が「大きな動詞」だとしたら、動きの小さな動詞もあります。

become(~になる), look(~のように見える), sound(~に聞こえる), seem(~のように見える), get(~になる), make(~になる), taste(~の味がする), feel(~に感じられる), smell(~の匂いがする)

このような動詞は絵にしたときにとても分かりにくい動詞です。ですがこのような動きの小さな動詞を大きな動詞と組み合わせて使うことで、表現力のある絵になります。

AIは人間の言語を全て正しく理解しているでしょうか?AIが賢くなっていくと「絵を描くこと」だけではなく「人間の言葉を理解する能力」も高くなってやり取りが楽にできるようになるでしょう。

でもまだ今はAIはそこまで賢くありません。賢くないとどうなるかというと、「忖度ができない」んですね。

人間は皆「これくらいわかるだろう」とか「こんなことわざわざ言わなくても当たり前だ」と思っているようなことがあります。それも全部言葉にしてやらないとAIはわからないんです。

日本に今日到着したばかりの外国人や生まれたばかりの赤ちゃんを相手に言葉を使うようなものです。AIにはこちらが配慮してやらないと通じないんです。

ですからあれこれと細かく指示をしていたら「沢山の主語」や「沢山の動詞」を同時に記述しなければいけなくなります。でもそのまま書いたらAIは混乱してちゃんとした絵を描いてくれません。これこそ最高にグチャグチャしてわかりにくくはたから見た時に「難しいプロンプト」に見えるはずです。

そんな時は、この図式を思い出して「どうしても絶対に記述しなければならないもの」を1項目につき1つずつ記述していけば大丈夫。不思議とAIは上手く描いてくれるものです。


「メインで描きたいもの(S、V、O、C)、それ以外に描きたいもの、背景」
              +

・2D/3D、写真か絵か
・美学、ジャンル、媒体
・色(配色、色相、彩度、明度)
・線、輪郭、ブラシワーク、影
・素材、質感、模様、形状、図形
・印象、感情、ストーリー性
・天気、場所
・ディティール、クオリティ、コントラスト、調和
・構図、余白、ポーズ、カメラアングル、フォーカス、ライティング
・画像比率

同じ項目を3つも4つも記述すればそれは「重複」や「重ね掛け」という手法になります。他のワードとの組み合わせ次第で効果があることもありますがないことのほうが多いので効率は悪いです。

色や素材は絵の仕上がりに大きく影響を与えるので、無指定だと絵はランダムになりがち。固定した絵を計画的に描きたいなら省略するのは良くないですね。

天気や季節を指定すれば服装や背景、ライティングなどもある程度決まります。カメラアングルとフォーカスとライティングはある程度関連性があるので1つ選択すると自動的にそれ以外も関連する描写になりがちです。この場合は個別指定しても通りにくいことも。AIのこだわりが強く出る部分です。

後は画像比率によって特定の画風が出たりでなかったりすることもあります。どの画像比率で行くかというのも大事なことです。

これがAIアートの文法の基礎です。


ただしchatGPTなどを使ったプロンプトは主語を明確にしなくてもなぜか狙ったものが描かれてしまう不思議な長文プロンプトを書いてくれたりします。

AIと人間のコミュニケーションに必要な言葉は決して1つではないということでしょう。

どんな言い方であっても、上手く伝えることができれば狙った絵を描いてくれます。セオリーにとらわれず自由な発想で新しいプロンプトを生み出していくのも楽しいことでしょう。

でもどうしても困った時は、基礎に立ち戻ってみるとちゃんと描けるはずです。

AIアートが上手くなりたいならば、「絵に描いてあるものを言葉にする訓練をすること」が一番の近道です。

そして「呪文をコレクションするのではなく、正しい言葉でAIに描いてほしいものをきちんと伝えること」が大事。そうすれば主語の装飾がいかに大切かわかると思いますし、動詞の大切さが理解できるようになれば必ず描いたキャラクターが思い通りに動き出してくれるはずです。

そして「絵を構成する要素をきちんと語順に合わせて組み立てていくこと」も大事。単語がバラバラとしていたらAIも頭がこんがらがっちゃいますよね。わかりやすい順番というのは存在すると思います。それが文法ですね。


この3つをきちんとこなしていれば、必ず狙った絵を描けるようになれます。

まとめますよ!

文法の基礎は、
「メインで描きたいもの(S、V、O、C)、それ以外に描きたいもの、背景」
              +

・2D/3D、写真か絵か
・美学、ジャンル、媒体
・色(配色、色相、彩度、明度)
・線、輪郭、ブラシワーク、影
・素材、質感、模様、形状、図形
・印象、感情、ストーリー性
・天気、場所
・ディティール、クオリティ、コントラスト、調和
・構図、余白、ポーズ、カメラアングル、フォーカス、ライティング
・画像比率

上手くなるために必要なことは次の3つ!
「絵に描いてあるものを言葉にする訓練をすること」
「呪文をコレクションするのではなく、正しい言葉でAIに描いてほしいものをきちんと伝えること」
「絵を構成する要素をきちんと語順に合わせて組み立てていくこと」

AIアートはプロンプトを入れれば数分で完成するので「楽をして簡単に絵が描ける」と思われがちですが、狙った絵を描くのは決して簡単ではありません。自分が希望していない絵がドバドバと生成されて悩ましく思うものです。「上手に描きたい、思い通りに描きたい」と思うなら沢山練習が必要で、それは実際に手で絵を描く練習をするのと同じくらい時間を要するものです。何事も簡単ではないですよね。

特に同じAIを大勢で使う場合は、自分だけが頑張ってもいい絵を描けるようにはなりません。大勢がいろんな絵を描かせるからこそAIが賢くなって良い絵が描けるようになります。

リンゴの絵が簡単に上手く描けるのは今までたくさんの人がリンゴの絵を描かせてきてくれたからです。AIは初めて描くものは上手に描けないですから、いい絵がすぐに出た場合は似たような絵を描かせてくれた誰かがいたということです。

多くの仲間への敬意を忘れず、AIアートを楽しみましょう。

なんでも急がば回れ。
めんどくさそうに見えますがこれこそが、AIアート上達の近道だと思います。

この記事が参加している募集

やってみた

この記事が気に入ったらサポートをしてみませんか?