日々の壁打ち：AIに『彼岸の向こうからやってきた少女』を描かせる

2024年4月8日 02:49

2024/04/08更新：カバー絵を交換。新規に絵を6枚追加しました。

𝕏に載せたポストの要約

𝕏にこんな内容のポストを載せた。本文は長いので後回しにするが、まずは要約を読んでざっくりと内容を把握して欲しい。

デジタル技術の発展は、私たちに新たな問いを投げかけている。その問いとは、「デジタル化によって、全てがコピー可能になる」ということの意味だ。

例えば、生成AIの登場により、創作活動の在り方が変わりつつある。障害を持つ人でも創作の喜びを味わえるようになる一方で、「オリジナル」と「コピー」の境界は曖昧になっていく。

また、LAIONのような膨大なデータベースは、私たちの大切な思い出をも「58億5000万枚の画像の一つ」に変えてしまう。それは、この世のカルマから解き放たれた「彼岸の世界」のようだ。しかし、現実世界では、そうした変化を受け入れることは容易ではない。

そもそも、デジタルデータと人間の感情は一対一で対応しているわけではない。失われた家族への想いは、LAIONのような膨大なデータベース内でデジタル化された画像とは別物なのだ。

デジタル世界と現実世界のスケール感の違いが、新たな倫理的課題を生んでいる。私たちは、その違和感の正体を見極めなければならない。

「デジタル化する」ということの本質を理解し、技術と人間の関係性を問い直すこと。それが、これからの私たちに求められているのではないだろうか。

𝕏のポストをイラスト化する

『日々の壁打ち』のカバーイラストでは、DALL-E 3やStable Diffusionに、その内容にあったイラストを発注している。ほとんどは、その内容にマッチするように、事前にプロンプトを用意しているのだが、時々遊びで𝕏の自分のポストをそのままイラストに変換させたりしている。主に自作GPTsである『Japan Anime Character Maker』を使ってだが。

今回は、『Japan Anime Character Maker』を使った得られたDALL-E 3によるイメージを、Stable Diffusionでさらにキャラ絵にしてみた例である。

準備段階：ChatGPT-4にポストの内容を解析させる

ポストの全文をそのまま絵にしようにも、絵にはならない。
だからまず最初に、ChatGPT-4自身にそのポストの内容を解析させ、理解させるのがポイントである。

上の分析を、続いてイラスト制作に特化したGPTs『Japan Anime Character Maker』に与える。

DALL-E 3のイラスト

あまり面白い絵ではないが、欲しいのはこの絵ではなく、プロンプトである。それはこんな感じのものだ。

A contemplative anime-style character standing before a vast, digital landscape. The scene merges the ethereal beauty of a watercolor background with elements of digital icons and binary codes subtly integrated into the horizon. The character gazes towards the horizon, embodying the intersection of traditional creativity and digital innovation. The color palette combines soft, watercolor hues with hints of digital, neon-like accents to highlight the theme of digital transformation and its impact on identity and creation. This artwork represents the blending of the physical and digital realms, and the thoughtful examination of new technologies reshaping our perceptions and realities.

日本語訳：
広大なデジタルの風景の前に立つ瞑想的なアニメスタイルのキャラクター。このシーンは、水彩画の背景の幽玄な美しさと、水平線にさりげなく組み込まれたデジタル・アイコンとバイナリ・コードの要素を融合させている。地平線を見つめているキャラクターは、伝統的な創造性とデジタル革新の交差点を体現している。カラーパレットは、柔らかな水彩画の色合いと、デジタルのネオンのようなアクセントを組み合わせることで、デジタルトランスフォーメーションと、それがアイデンティティやクリエイションに与える影響というテーマを際立たせている。この作品は、物理的な領域とデジタルの領域の融合、そして私たちの認識と現実を再構築する新しいテクノロジーに対する思慮深い考察を表している。

Stable Diffusion用のプロンプトに変換する

続いて上のDALL-E 3のプロンプトをStable Diffuisonに与えてやるために、テーマを残しつつ、最適化してやる。例としてはこんな感じだ。

Positive Prompt: A contemplative anime-style character standing before a vast, digital landscape, embodying the intersection of traditional creativity and digital innovation, The scene merges the ethereal beauty of a watercolor background with elements of digital icons and binary codes subtly integrated into the horizon, The character gazes towards the horizon, surrounded by soft, watercolor hues mixed with hints of digital, neon-like accents, highlighting the theme of digital transformation, This artwork represents the blending of the physical and digital realms, with a thoughtful examination of new technologies reshaping our perceptions and realities, natural light, film, professional, 4k, highly detailed, Golden hour lighting , masterpiece, best quality, very aesthetic,

日本語訳：
広大なデジタルの風景の前に立つ、瞑想的なアニメ風のキャラクター, このシーンは、水彩画の背景の幽玄な美しさと、水平線にさりげなく組み込まれたデジタルアイコンとバイナリコードの要素が融合しています, この作品は、物理的な世界とデジタルな世界の融合を表現しており、私たちの知覚と現実を再構築する新しいテクノロジーについて思慮深く考察している, 自然光, フィルム, プロフェッショナル, 4k, 高詳細, ゴールデンアワー照明, 傑作, 最高品質, 非常に審美的,

日本語訳を読むと、DALL-E 3のプロンプトをもう少し形式化したものであることがわかると思う。敢えてキャラクター部分の指定は、"A contemplative anime-style character"（瞑想的なアニメ風キャラクター）のまま、曖昧にしておくのがミソである。

これをStable Diffusionへポジティブプロンプトとして与えてやり、画像を生成させると、以下のようなイメージが得られた。

2枚目でキャラクターのイメージが大きめになった。
後は、膨らませてやるだけである――。
これが結構面白い感じになった。いくつか紹介しよう。

Stable Diffusionによる、キャラ絵としての作例

足元に見える、仮想のデータ空間の上に立つ少女のイメージ。これが、面白いと思ったきっかけの絵だが、𝕏にはこんなことを書いた。

あ。すごい。この書いた一連のポストをChatGPTに分析させて、DALL-E 3にイラストとして描かせ、それをStable Diffusionにキャラ絵として生成させたら、『百億の昼と千億の夜』に出てくる、ディラックの海に飲み込まれたノア・クリークのようなイメージが出てきた。こういうのって、言語が絵になるって印象で面白い。

これも好きである。彼岸の向こうから少女がやってくるイメージ。

こちらもデータ空間から、少女が生まれるイメージである。

この絵は、厳密には画像生成AIがよく作る「おかしな絵」なのだが、「破綻しているが故に面白さが出た例」として残すことにした。
敢えて手で修正をしてある部分がどこか、わかるだろうか。
結果現れる、中央を軸にした線対称構造と、不完全な線対称構造のモチーフが面白い。
画像生成AIが作るイメージには、人の手が加わることで作品になるものも、しばしばあると思う。

この2枚は、同じデジタル少女といったイメージだ。データ的な表示がスカート部に現れるのは、ミクさんのイメージを偲ばせる。
1枚はデータが生み出した「海」、もう1枚はデータの「太陽」なのは面白い。

最後の3枚は意味があるんだかないんだかわからない、少女のイメージ。
ひとつ言えているのは、皆、「夜明けの海」がモチーフになっている。
『彼岸』とは、あちら側の岸辺のことで、行く場合は西に向かって進むのだが、やってくるとしたら東側。故に「夜明けの海」なのかもしれない。
元々『弥勒』とは、彼岸からこちらの世界にやってくる者を指す言葉だ。
彼女らのイメージは、現代の『弥勒』なのかもしれない。

追記：この3枚の一番最初の絵、少女が持っているスマホのようなものが、自撮りをしているようでいて、そうでない代物がよくわからなかったのだが、やっと意味がわかった。これはこの『彼岸空間』に浮かんでいるデータのひとつなのだ。実際、他の絵でも沢山空間にアイコン状のデザインで浮かんでいるではないか。最初のDALL-Eのプロンプトにあった、" elements of digital icons and binary codes subtly integrated into the horizon"のひとつを、彼女はこの世界に持ち込んだという、絵解きなのだ。
彼岸の海から現れた少女が僕らに問いかける言葉は、恐らくこのようなものだろう。
「この思い出は、どなたのものですか？」

どれもこれもが、共通の『デジタルが生み出した彼岸』という世界観を活かしながら、キャラ絵になっているのが面白い。このキャラ絵としての膨らませ方は、『Danbooru タグアップサンプラー』を使っている。これも生成AI技術が生み出す、一期一会としての出会いを楽しむ為である。

元の𝕏でのポスト

最後に𝕏でのポストの全文を載せておく。
ここで「彼岸」と表現したものは、「58億5000万」というとんでもない数のことだ。

最初の要約にも書いたが、デジタル世界と現実世界のスケール感の違いが、新たな倫理的課題を生んでいると思う。
私たちは、その違和感の正体を見極めなければならない。

なんだろう。新らしい技術が生まれるということは、同時に今まではそういうものだと受け入れていたことが、また別の新しい意味づけを持ち始めるということなんだろうなァ。

そんなことを思うようなポストを読んだ。

多分、自分が酷く刺激を受けたということは、恐らく誤解したり、歪曲して読む人もいるだろうから、リンクは貼らない。

しかし何に感銘したかは書いておきたい。そこで指摘されていたのは、デジタルで作業することの本質を突いていることだった。新しい技術の登場は、その本質を再び明らかにすることに過ぎないのだということだ。

その本質とは、「デジタル生成物は、本質的にはオリジナルの完全なコピーができる」ということ。そんな判りきったことが、新しい技術が生まれる度に、改めて別の意味を持ち始める。

デジタルで「何か」を出した時点で、それはコピー可能となる。

『コピー可能となった大量のデータは、それはもはや通常の意味での「ホンモノ」ではない。何故なら、同じものが無限にコピーできるから。

ホンモノとは本来ひとつしかないもので、それは失われてしまえばそこまでのもの。だからこそ真の価値があるのだ、という指摘。

デジタルで何かをやるということは、本質的にはPCでデータを作っているだけなのだ、ということ』

恐らく生成AIはまたこの点に新たな意味を生み出しはじめている。

現実世界に存在する「道具」とデジタル上にしか存在しない「ツール」、それらを使う「人」、そして単なるツール以上のことが出来、場合によっては、身体に障害があり通常の創作活動ができない人にすら、創作活動の楽しさに誘うことができる「生成AI」。それらの関係が生み出す、光と闇。

「そのことを、デジタルを使い始めた時に、あなた方は最初から理解すべきであったのだ」と、『人形遣い』なら言い出すことだろう。いや、もうすでに、彼は我々のすぐ側で囁いて居る最中なんだろう。

そんな瞬間に僕らは立ち会っているのだ。

その感銘したポストの前に読んでいたのは、読売新聞が伝えた、『LAIONがクロールしたニュース画像をStable Diffusionがベースモデルの学習に使っていることは、死者の画像の肖像権への侵害にならないか？』という記事だった。

この記事を読んで、正直感じたのは、また難しい問題を…ということだが、その「難しさ」を表現するのが、これまた難しかった。そこを言葉にしてくれたのが、「デジタル化されれば全てはコピー可能になってしまうのだ」という、ごく当たり前の指摘だった。

そもそも『LAION 5-Bとは、画像とテキストが対応しているデータベース。その数は約58億5000万枚』というものだが、そんな膨大な数のなにかなど、今まで人類は宗教上の蘊蓄でしか見たことがないはずだった。良い例が弥勒菩薩が復活する時期だ。それは「56億7000万年後」とされている。歴史を紐解くと、そんな遥か彼方の未来に対しても、人は救いを求めてきたのだ。それは弥勒信仰というタームを調べてみれば、よくわかることだろう。驚くべきことに、LAION 5-Bの規模はそれを上回る「58億5000万」だ。そもそもこの数字を見た時に、もっとピンとくるべきだった。これは彼岸の存在だ。

彼岸の世界とは、この世の中の全てのカルマから解き放たれた世界のことだ。そこはこの世から遥か離れた遠くに存在する。ある人にとってはどんなにかけがいのない、失われた家族の大切な思い出であっても、それは彼岸の世界に置かれたら、「輝く硅砂の砂粒」のひとつになってしまう。もはやそうなってしまえば、そこには何の苦しみもなく、全ては一切解脱の世界へと導かれることになる。故に彼岸の砂浜で輝く硅砂の砂粒のひとつになることは、恐れることではない。しかし同時に、それは現実世界ではなかなか理解されることではない。

そのことは、大昔から人類には判っていたので、その世界から救世主がやってくるためには「56億7000万年」もの時間がかかる、と「永遠に不可能なこと」を説明してきたのだ。

それが出来るようにしてしまうのが、「デジタル化する」ということの本質なのだ。

この「58億5000万」というとんでもない数字の画像とテキストを組み合わせることを可能にしたデジタル化技術と、家族の各々の中に残る失われた人々への想いというホンモノの気持ち。必ずしもそれは、「58億5000万」というデータベースの中にある、デジタル化されたイメージとは、そもそも一対一対応しているものではないはずなのだ。

自分が感じた「説明することの難しさ」の実態は、そういうスケール感の違いが引き起こす違和感だった。

なんとか言葉にすることができたような気がする。

この記事が気に入ったらサポートをしてみませんか？