見出し画像

WOMBO Dream は「AI "で" 作ったアート」 or 「AI "が" 作ったアート」?

ご無沙汰してます、Almina です。2億年ぶりくらいに note 書いてます。
2022年もすでに1ヶ月が経っちまいましたが、みなさまいかがお過ごしでしょうか。

さて、昨年末からデジタルアート界隈が盛り上がってますよね。
メタバース、NFT アート、AI アート、、、数々のビッグテーマが飛び出してきて、世界的にも注目が集まってます。wktk。

今日は、その中から「AI アート」について書きます。

というのも、こないだ Twitter でこんな投稿を見かけまして、、、

最近 Twitter で話題になっていた WOMBO Dream で描かれた絵に対するコメントですね。要するに「『AI "が" 作ったアート』と呼ぶべきではない」という指摘で、とても鋭いなあと思いました。
(さすが AI アート界隈で先進的に活動されている方々なだけあるよ。。。)

もちろん私も直感的には同意見なのですが、、、ふと疑問に思いました。

「なんでコレを『AI "が" 作ったアート』とは言えないんだろう?」

フラットに考え直してみると、絵を出力してるのは AI なので、たしかに一見 AI "が" アートを作ってるんですよね。ただ、いざ「AI "が" (略)」と言われてしまうと、どこか違和感もあって、、、
改めて問われると、実は解釈が難しいテーマだな、と思いました。

なので今回は「AI アートにおける主体性」について考えてみます。

なお、あくまで私なりの解釈を述べたものになりますので、ぜひみなさまもご自身なりに考えながら読んでみてください。

それでは、しばしお付き合いくださいませ。

(※ 主はただのアート素人です。温かい目で見てください。。。)

そもそもアートって何だっけ?

まずそこですよ。「いや、アートって何やねん」と。

とりあえず軽く由来をググってみると、、、

・ラテン語の "ars" が語源
・本来は "芸術" というより、自然に対置される人間の "技" や "技術" を意味する (ギリシャ語の "テクネー" に近い)
・しかし産業革命以降、科学による実用的な創造物は "technology" と呼ばれるようになる
・"art" の広義から "technology" が分離して使われるようになり、現在のようなニュアンスに変化した

ってところだそうです[1][2]。いやー勉強になるなあ。

つまり、アートとは言うなれば

何らかの意思や意図のために技術を駆使して創造されたもの

ってところでしょうか。

由来に出てきた「自然に対置される」ことを踏まえても、アートでは "意思" こそが重要な要素であり、"その作品への意思を持つ存在" がアートにおける "主体" と呼ぶべきなのでしょう。ここが、今回のテーマである「AI アートの主体性」を考える上でカギになってきそうです。

AI アートはどうやって作られているのか?

続いて、AI アートではどんな登場人物がいるのか・どんなことをするのかを整理するため、AI アートを作るプロセスを追いかけます。

ここで、AI アートと一口に言っても様々なタイプがありますよね。
AI の出力そのものではなく、AI の出力を受けて人間が起こすアクションを作品としたものだったり、、、

ただ今回は、WOMBO Dream に相当する「AI 出力そのものを作品とする」タイプの AI アートに絞ります。風呂敷を広げすぎないことが大事。。。

さて、まずは WOMBO Dream のような AI アートを作るプロセスを分解していきますが、大きく分けると2つのプロセスがあります。

1.エンジニアが AI モデルや学習方針を設計する
2.AI が学習したパラメータに基づく計算によって画像を出力する

うーん、抽象的ィ、、、
それぞれのプロセスをもう少し具体的に見てみましょうか。

まず「1.AI モデルの設計」について。
ここでは専門的なことは省きますが、簡単に書くとこんな感じ。

1-1.   エンジニアが AI モデル構造および目的関数を定義する
1-2.エンジニアが学習データ・評価データを用意する
1-3.乱数で初期化された AI モデルにデータを入力し最適化学習させる

つまり、どんな AI モデルにするかは "エンジニア" がデザインしているようです。ただ  (1-3) を踏まえると、エンジニアが全てコントロールしているわけではない、とも言えそうです。

次に「2.AI モデルによる画像生成」について。

専門的な話は割愛させてください。(もはや論文になりそうなので)
ただ、WOMBO Dream のような AI アートは多くの場合 "GAN (Generative Adversarial Network)" という深層学習モデルで作られることが多いです。
(ちなみに WOMBO Dream は "VQGAN + CLIP" という話題の複合モデルじゃないか、とウワサされてたり???)
もし GAN について知りたい方は、ぜひググってみてください。。。

さて、じゃあ AI モデル (あるいは GAN) が画像生成プロセスにおいて何をしているかという話ですが、簡単に書くとこんな感じ。

2−1.学習したパラメータとモデル構造に従って計算結果を出力する

そう、AI 自身がやっていることは、実はコレだけだったのです。

つまり、AI アートを作るというのは

・主な登場人物は「エンジニア」と「AI」
・エンジニア:ある画像が生成されるよう設計する (一部乱数)
・AI:パラメータとモデル構造に応じて計算する

といったところになりそうです。

だいぶ AI アートで「誰が・何をしているか」が具体的に見えてきました。

では AI アートの "主体" は誰なのか?

さて、いよいよ本題について考えてみます。

おさらいですが、アートは「何らかの意思や意図のために技術を駆使して創造されたもの」でした。つまり、アートにおける "主語" は「作品に対して意思や意図を持っている存在」であるべきでしょう。

では、先ほど整理した AI アートのプロセスに照らし合わせて考えてみます。

まず、今回の AI アートにおいて作品に相当するのは "画像" でした。
では AI アートのプロセスの中で、この画像に対する "意思" を持っていたのは誰だったのでしょうか?

それは、AI モデルや目的関数を設計した「エンジニア」だと思います。

たしかに、画像を生成しているのは紛れもなく AI でした。ですが、先も述べたように、あくまで学習したパラメータの値と計算式に基づいてコンピュータが計算を実行しているだけなのです。

これは、いわば "自然現象" に近いと言えないでしょうか。
例えば「置かれた岩々によって川の流れが変わる」のと同じように、そこに存在する要素 (パラメータ) が、法則 (計算式) に従って干渉しあい、現象として発現したもの (画像出力)、と言えるかと思います。

こう考えると、自然現象がそうであるように、AI は発現するものに対して意思を持っていないと言えるでしょう。むしろ先の例で言うなら、川に岩々を置いた存在こそが "意思" を持っていたのではないでしょうか。そして、それは AI アートのプロセスにおいて「エンジニア」が相当します。

なので、ここまで考えてきた結論としては

・AI アートにおける "主語" は「エンジニア」である
・「AI」は "創作するために駆使した技術" に相当する

となりました。

(アートが「自然と対置される」という観点とも合ってますね。。。)

「AI "が" 作ったアート」は全くの誤り?

さて、先ほど「AI アートの主語は "エンジニア" である」という結論に至りました。なぜなら「AI 自身は出力に対して "意思" を持ってない」からです。これは、冒頭で紹介した御方々のご意見とも合っていると思います。

...ですが、さらに1つ疑問が浮かびました。

「ホントに『AI 自身が出力に対して "意思" を持つ』と言えないのか?」

先ほどの結論は「エンジニアが主語であるべき」というものでした。ただ、それは「『AI "が" 作った』と言えない」理由ではありません。

なので、ここについてもう一歩踏み込んで考えてみたいと思います。

AI アートにおいて "AI" は全く意思を持たないのか?

さて、そもそも私が疑問を感じた理由はこんなところです。

「人間の意思だって、自然現象みたいなもんだって言えるんじゃない?」
「所詮、脳内でシナプスどうしの電気信号のやり取りによって動いてるだけでしょ。それも自然現象じゃない?」
「逆説的に言えば、ただの脳内信号を "意思" って呼ぶなら、AI やコンピュータの中で起こる計算や信号のやり取りも "意思" と呼べるんじゃない?」

、、、まあ、屁理屈に見えますよね。

でも、これは別に私だけが感じている疑問ではないのです。
実際、AI の "意思" をどう考えるかは様々な議論がなされています[3][4]

さすがにこれら全ての主張を追うのは難しいですが、、、
今回は私なりの解釈を展開してみたいと思います。

先に結論から言うと、こんな感じです。

・AI アートには "AI の意思" (と呼べなくはない) 要素が含まれている
・高度な AI であれば、そのプロセスは "意思" のごく一部に近いと言える
・ただし、本来の "意思" における 1% くらい (超単純意思?)

要は「AI の "意思" も僅かに含まれている」という見方になります。

その前提として、まず "意思" とは簡単に下記のようなプロセスと考えます。

1.すでに学習された既知のモデルから出力を展開し (トップダウン)、
2.同時に、入力された情報を畳み込んで認知し (ボトムアップ)、
3.そのズレが小さくなるよう、互いの擦り合わせを行い (最適化)、
4.また過去の経験も加味して最適な解を出力する

このように定義した場合、AI モデル (特に GAN) の計算プロセスと照らし合わせると、対応している (と言えなくはない) 計算が含まれています。

つまり、AI モデルが画像生成するプロセスは、"ただの自然現象" を超えた、限りなく "意思" のプロセスに近い現象とも言えるのではないでしょうか。

、、、とは言え、このプロセスはかなり極端な例ですよね。(当然)
私たちが持っている "意思" がこんな単純なプロセスだとは到底思いません。認知科学者の方々からすれば、もはや暴論なのでしょう。スイマセン。。。

ただ、これも "意思" のごく一部に含まれるプロセスではないでしょうか?
特に高度な AI であるほど、より "意思" (の一部) に近いプロセスと言えるのではないでしょうか。

なので、AI アートにおいて AI が行うプロセスとは、ある意味で "意思" とも呼べなくはないものだと思います。

結局「AI "が" 作ったアート」と言えるのか?

さて、先ほどまで「"AI" も AI アートに対する "意思" を持った存在である」と主張しました。そうすると、"AI" は AI アートにおける "主体" となり得るのでしょうか?

私の答えは、やはり No です。

ですが、当初の結論とは若干異なります。厳密には、こう考えます。

・現在の AI アートにおける主体は "エンジニア" と言うべきである
・ただし、AI の意思も AI アート作品には一部存在していると言える

そう、AI の意思は "全くない" のではなく、"一部存在している" と思います。
つまり、私は「AI "が" 作ったアート」は 100% 間違いではないと思います。

もちろん、先も述べたように、現在の AI が行う計算プロセスを "意思" と呼ぶには極めて遠いとも思います。"一部存在する" と主張してますが、ごく単純な、 "意思" と呼べなくはない計算プロセスが一部含まれている、くらいのニュアンスが正直なところです。

ですが、実はゼロとも言えないんじゃないか、というのが私の考えです。
「エンジニア:AI = 99 : 1」くらいかもしれませんが、"AI の意思" ともいうべき要素が入ってるのではないか、と思います。

今回の結論

最後にまとめます。

「AI アートは "誰が" 作ったと言うべきか?」

と今回の問いに対し、私の結論はこうなりました。

・AI アートでは、AI モデルを設計している "エンジニア" が主体というべき存在である
・ただし "AI の意思" (と呼ぶべき) 要素はゼロではなく、ごく僅かだが存在している (1% くらい)
・AI の計算プロセスが私たちの "意思" におけるプロセスと限りなく近づいたとき、はじめて "AI" が AI アートにおける主体となり得る

あとがき

さて、ここまで読んでくださった方はありがとうございます。いかがでしたでしょうか?

長々と書いてしまいましたが、まあ正直言って何か正解があるわけでなく、完全に私の独断と偏見と極論を繰り広げただけですけども。。。
ですが「AI アートの主体性」という難題に対して、ここまで深く・正面から向き合うこともなかったので、勉強になった部分も多くありました。

ただ、おそらく今回の内容で間違っている箇所も多いと思います。
もし気になった方がいましたら、ぜひコメントで指摘してください。

また、みなさまは今回のテーマに対してどのような結論に至りましたか?
ぜひみなさまの持論もコメントで教えてもらえると嬉しいです。

では、また次の記事でまたお会いしましょう。対あり!

(p.s. 書き始めて5分で後悔してましたが、何とか書き上がった。。。)

参考

[1] https://aeneis.jp/?p=7980
[2] https://artfans.jp/art-origin/
[3] https://www.itmedia.co.jp/news/articles/2003/19/news138.html
[4] https://note.com/sayzcoba/n/nc48d8da3a6bd

この記事が気に入ったらサポートをしてみませんか?