見出し画像

AI漫画のための技術的な整理と人間の知的創造におけるAIの歴史的意義の考察メモ

AIで漫画を作っていくにあたっての現時点での課題点


 ずっとイラスト保育園児レベル人生だったので、亀の歩みで動画漫画制作の道を歩んでおりますみこちゃんです!妹に作業をやらせている間も、せっせと次どういう指示を出したら良いかお勉強しています……。実制作も勉強もとっっっっっても楽しいです!

 AIで漫画を作るにあたっては、AIで画像を生成するテクニックに加えて乗り越えなくてはいけない必須課題があります。

 それは、現時点でのAIイラストの生成はイラストに人格(首尾一貫性という自己同一性)を与えにくいのです。

 どういうことかといいますと、AI画像生成技術はランダムに次々と際限なく高いクオリティの画像を生成してくれるのですが、プロンプトをいじるだけだと、微妙に画像が変化してしまうのです。

 現時点でのその限界がこれです。

 右の方がAIで生成した画像で、これは確かにすごい良質なイラストになっていますが、よくよく見るとピンクのスーツが違ってますよね。

 2つ目のスーツはいつの間にかボタンを外しているので、白いブラウスが見える面積が不自然に大きいです。そのままなら、なんかの都合で胸元のボタンを外したと強弁できなくもないのですが、3番めでまたもとに戻ってボタンが留められています。
( U_U)また、3番めで今度は白いブラウスの第一ボタン外してますね。何か意味があるんでしょうか(笑)。
 そして、極めつけなのが4番目でなんと、胸に可愛いうす黄色の縁取りポケットが出現(笑)。これはさすがにボタンと違ってその場ではどうしようもないはず。よく見ると4番目よりも目立たないですが、すでに最初の画像でポケットはありました。

 こういうのはseed値というので、ある程度はごまかせるのですが、この画像生成ではもちろんseed値を使っています。

 じゃあ、どうすんだー(゚0゚)。

正統的な解決方法を模索するのだ!

 一つには、こういう微調整をやるために、プロのイラストレーターさんや絵師さんたちの定番ツールを使って補助的に手作業で直すことです。もうひとつはさらっと後述するようにPythonなどで、Stabe Diffusionを拡張することです。

 みこちゃんが今新しく勉強中なのはこれです。

 これをある完璧ではなくとも満足の行くレベルでマスターするのは多分数年はかかると思います。そしてさらにその先のレベルに達して、これを使いこなせたらすごいのですが、つい数週間前に保育園児を卒業して小学生になったばかりのみこちゃんにはハードル高すぎです。

 そこで、これをAI画像生成の補助ツールとして使うという発想が必要ですね。

 もっとも、この方向性はクリップスタジオの既存ユーザーの方からすると、邪道な使い方で、多分この記事書いた今この瞬間から、みこちゃんはクリップスタジオユーザーの方からは嫌われそうな気がして、ちょっと悲しくもあります。

 クリスタそのものが、AIを補助ツールとして実装しようとしたのですが、「今後そういうことはもうしない」宣言でようやく収まった感じです。

・現状の方式の画像生成AIが、著作権を侵害していなくとも、誰かの著作物を利用して画像が生成されており、その由来が不明であるアプリは使いたくない。

・アーティストの為のツールを名乗っているが、画像生成AI機能はむしろアーティストを苦境に追い込み、その活動を阻害する。

・倫理的に問題がない方法で収集されたデータを利用していないのであれば、使えない。

・CLIP STUDIO PAINTを使っただけで、画像生成AIで作ったと疑われてしまう。

・なぜ要望が多い機能の改善に取り組まずに、問題視されている機能を追加するのか理解できない。

・信用できない機能が搭載されている道具は、創作のパートナーとして受け入れられない。

・他者の権利が侵害される可能性のある画像が生成され得る機能を提供しておいて、そうならないよう自身で気をつけてほしい、というセルシスのスタンスは無責任だ。

いずれのご意見も重く受け止めており、私達は完全に認識を改めました。

セルシスは今後、このような懸念がある画像生成AIを用いた機能をCLIP STUDIO PAINTに搭載いたしません。

上記記事より引用
強調はみこちゃん
・の部分がユーザーからの意見
(同一人物ではない)

 もともと、みこちゃんは育ちがイラストレーター界隈ではないので、その肌感覚としての拒否感がどこまでのものか分かりかねる部分もあるのですが、反発する人が多いというのは分かります。

 ともあれ、クリップスタジオメーカーの方は、既存ユーザーの方を大切にするという会社としての一大方針を宣言したわけなのでした。

 ということで、AI画像生成と組合せて使っていくことに関しては地道にノウハウを自分で積んでいくしかなさそうです……。

入り口の敷居は下ったけど出口の高さはまったく変わっていないと考えることが大事

 AIの画像生成はいろんな問題を投げかけていますね……。

 一言だけ、この分野のことに疎い、肌感覚の分からないみこちゃんの感想ですが……。

 みこちゃんは、アナログでクラシックの交響曲を総譜(スコア)を念頭に作曲して鉛筆で譜面に書き起こすことも出来ます。

 でも、自動作曲のツールというのはすばらしいと思います。自動作曲で作曲の敷居は下がりました。もっとも、大切なのは(ここは最大限強調したいですが)最初の敷居は下がったのですが、最後の出口の高さはまったく変わっていないということです。

 作曲は膨大な理論が、本当に頭をどれだけ下げていいか分からないほど(みこちゃんはいつも作曲するときには三跪九叩頭の礼で地中に頭が全部潜ってます)、バッハ以前から、そして、それ以後も真摯に積み上げられて今日のノウハウを人類は手に入れてきました。

画像出典:Hassum's Paddock Club

 それを無視して、AI作曲だけで自分は作曲ができるようになった、と言う人には「おいおいちょっとまて」と言いたくなります。

 おそらく、絵画の世界、イラストの世界からAI画像生成への反発はこれじゃないかな、と思うのです。だから、これは非常によく分かります。

 ですから、みこちゃんとしては、絵画の技術の歴史、イラストの技術の歴史に最大限の敬意を払い、そして入り口の敷居は下ったのかも知れませんが(これも否!という絵師さんも多いと思いますけど……)、既存の技術の膨大な頂上の高みを少しでも登る努力をしようと思います。

 その点ではAIの精度をあげようとPythonプログラムをやるばかりではなく(これも同時にやってますのでこれはまた別記事で)、クリップスタジオで、保育園児レベルから地道にこちらの道も歩んでいこうと思います。

これはやはり、人類が今後AIとどう向き合うかという問題になってくる

 おそらく、こういうことが、人類のこれまでの遺産の各分野で100年単位で起きるんだろうなと思います。

 共生はできるし、それにこういう、歴史の再構築、再生運動(ルネッサンスということです)は安易な棲み分けではなくなんらかの格闘であり、新しい、人類がこれまで見たこともないような何かを生み出す営為なのではないかなと思えます。

 途方もないことが起きてしまった時代に生まれ、生きていて、何だか最近うきうきしています。
(^-^)

 こちらはダルマ編集長の下、単に小説分野を超えてAI時代に人類にとって「創造」とは何かを考えるマガジンに生まれ変わりました。ぜひ、よろしくお願いいたいます!


この記事が気に入ったらサポートをしてみませんか?