2024/04/08更新:カバー絵を交換。新規に絵を6枚追加しました。
𝕏に載せたポストの要約
𝕏にこんな内容のポストを載せた。本文は長いので後回しにするが、まずは要約を読んでざっくりと内容を把握して欲しい。
𝕏のポストをイラスト化する
『日々の壁打ち』のカバーイラストでは、DALL-E 3やStable Diffusionに、その内容にあったイラストを発注している。ほとんどは、その内容にマッチするように、事前にプロンプトを用意しているのだが、時々遊びで𝕏の自分のポストをそのままイラストに変換させたりしている。主に自作GPTsである『Japan Anime Character Maker』を使ってだが。
今回は、『Japan Anime Character Maker』を使った得られたDALL-E 3によるイメージを、Stable Diffusionでさらにキャラ絵にしてみた例である。
準備段階:ChatGPT-4にポストの内容を解析させる
ポストの全文をそのまま絵にしようにも、絵にはならない。
だからまず最初に、ChatGPT-4自身にそのポストの内容を解析させ、理解させるのがポイントである。
上の分析を、続いてイラスト制作に特化したGPTs『Japan Anime Character Maker』に与える。
DALL-E 3のイラスト
あまり面白い絵ではないが、欲しいのはこの絵ではなく、プロンプトである。それはこんな感じのものだ。
Stable Diffusion用のプロンプトに変換する
続いて上のDALL-E 3のプロンプトをStable Diffuisonに与えてやるために、テーマを残しつつ、最適化してやる。例としてはこんな感じだ。
日本語訳を読むと、DALL-E 3のプロンプトをもう少し形式化したものであることがわかると思う。敢えてキャラクター部分の指定は、"A contemplative anime-style character"(瞑想的なアニメ風キャラクター)のまま、曖昧にしておくのがミソである。
これをStable Diffusionへポジティブプロンプトとして与えてやり、画像を生成させると、以下のようなイメージが得られた。
2枚目でキャラクターのイメージが大きめになった。
後は、膨らませてやるだけである――。
これが結構面白い感じになった。いくつか紹介しよう。
Stable Diffusionによる、キャラ絵としての作例
どれもこれもが、共通の『デジタルが生み出した彼岸』という世界観を活かしながら、キャラ絵になっているのが面白い。このキャラ絵としての膨らませ方は、『Danbooru タグアップサンプラー』を使っている。これも生成AI技術が生み出す、一期一会としての出会いを楽しむ為である。
元の𝕏でのポスト
なんだろう。新らしい技術が生まれるということは、同時に今まではそういうものだと受け入れていたことが、また別の新しい意味づけを持ち始めるということなんだろうなァ。
そんなことを思うようなポストを読んだ。
多分、自分が酷く刺激を受けたということは、恐らく誤解したり、歪曲して読む人もいるだろうから、リンクは貼らない。
しかし何に感銘したかは書いておきたい。そこで指摘されていたのは、デジタルで作業することの本質を突いていることだった。新しい技術の登場は、その本質を再び明らかにすることに過ぎないのだということだ。
その本質とは、「デジタル生成物は、本質的にはオリジナルの完全なコピーができる」ということ。そんな判りきったことが、新しい技術が生まれる度に、改めて別の意味を持ち始める。
デジタルで「何か」を出した時点で、それはコピー可能となる。
『コピー可能となった大量のデータは、それはもはや通常の意味での「ホンモノ」ではない。何故なら、同じものが無限にコピーできるから。
ホンモノとは本来ひとつしかないもので、それは失われてしまえばそこまでのもの。だからこそ真の価値があるのだ、という指摘。
デジタルで何かをやるということは、本質的にはPCでデータを作っているだけなのだ、ということ』
恐らく生成AIはまたこの点に新たな意味を生み出しはじめている。
現実世界に存在する「道具」とデジタル上にしか存在しない「ツール」、それらを使う「人」、そして単なるツール以上のことが出来、場合によっては、身体に障害があり通常の創作活動ができない人にすら、創作活動の楽しさに誘うことができる「生成AI」。それらの関係が生み出す、光と闇。
「そのことを、デジタルを使い始めた時に、あなた方は最初から理解すべきであったのだ」と、『人形遣い』なら言い出すことだろう。いや、もうすでに、彼は我々のすぐ側で囁いて居る最中なんだろう。
そんな瞬間に僕らは立ち会っているのだ。
その感銘したポストの前に読んでいたのは、読売新聞が伝えた、『LAIONがクロールしたニュース画像をStable Diffusionがベースモデルの学習に使っていることは、死者の画像の肖像権への侵害にならないか?』という記事だった。
この記事を読んで、正直感じたのは、また難しい問題を…ということだが、その「難しさ」を表現するのが、これまた難しかった。そこを言葉にしてくれたのが、「デジタル化されれば全てはコピー可能になってしまうのだ」という、ごく当たり前の指摘だった。
そもそも『LAION 5-Bとは、画像とテキストが対応しているデータベース。その数は約58億5000万枚』というものだが、そんな膨大な数のなにかなど、今まで人類は宗教上の蘊蓄でしか見たことがないはずだった。良い例が弥勒菩薩が復活する時期だ。それは「56億7000万年後」とされている。歴史を紐解くと、そんな遥か彼方の未来に対しても、人は救いを求めてきたのだ。それは弥勒信仰というタームを調べてみれば、よくわかることだろう。驚くべきことに、LAION 5-Bの規模はそれを上回る「58億5000万」だ。そもそもこの数字を見た時に、もっとピンとくるべきだった。これは彼岸の存在だ。
彼岸の世界とは、この世の中の全てのカルマから解き放たれた世界のことだ。そこはこの世から遥か離れた遠くに存在する。ある人にとってはどんなにかけがいのない、失われた家族の大切な思い出であっても、それは彼岸の世界に置かれたら、「輝く硅砂の砂粒」のひとつになってしまう。もはやそうなってしまえば、そこには何の苦しみもなく、全ては一切解脱の世界へと導かれることになる。故に彼岸の砂浜で輝く硅砂の砂粒のひとつになることは、恐れることではない。しかし同時に、それは現実世界ではなかなか理解されることではない。
そのことは、大昔から人類には判っていたので、その世界から救世主がやってくるためには「56億7000万年」もの時間がかかる、と「永遠に不可能なこと」を説明してきたのだ。
それが出来るようにしてしまうのが、「デジタル化する」ということの本質なのだ。
この「58億5000万」というとんでもない数字の画像とテキストを組み合わせることを可能にしたデジタル化技術と、家族の各々の中に残る失われた人々への想いというホンモノの気持ち。必ずしもそれは、「58億5000万」というデータベースの中にある、デジタル化されたイメージとは、そもそも一対一対応しているものではないはずなのだ。
自分が感じた「説明することの難しさ」の実態は、そういうスケール感の違いが引き起こす違和感だった。
なんとか言葉にすることができたような気がする。