見出し画像

生成AI時代のカンブリア爆発を生き抜くために…連休は性癖を走らせるまえに(謝辞と補足)

連休は"性癖"を走らせよう。

窓の杜で連載していた「いまからでも遅くない!ツールとして使うAI画像生成」の最終回が公開されました。

https://forest.watch.impress.co.jp/docs/shseri/toolsd/1497610.html

生成AI時代のカンブリア爆発を生き抜くための新しい生き方として、日進月歩、秒進分歩で進化し続ける、AI画像生成の技術革新に対応するため、

  1. スマホアプリだけで生成する年賀状イラスト

  2. プロンプト不要で生成できるサービス

  3. Webブラウザベースで利用できるサービス

  4. 個性を生かし自己実現する方法としてAutomatic1111/WebUIをローカルPCにインストールして、クラウド上で利用する方法までを紹介しております。

という流れで「まったくわからない人」が「"ちょっと触ってみた"以上」という状態になることを目標とした連載です。また全くどこから始めていいかわからない人向けにチャートも作ってあります。

https://forest.watch.impress.co.jp/docs/shseri/toolsd/1486170.html

今回はこの連載最終回振り返りながら画像生成AIを支えるヒューマン要素に目を向けてみたいと思います。

「性癖を走らせる」とは

ここで「性癖を走らせる」という考え方を提唱していますので補足しておきます。わかる人にはわかる感覚とは思うのですが、実は業界が違うとそうでもないらしい、ということに私は最近気づきました。

正直なところ、画像生成AI技術をちょっと覚えたぐらいで「何でも作れる」と思ってはいけないと思います。画像の探求には十分なマシンスペックに加えて丹念な作業が求められます。プロンプトの改善やモデルのチューニングには「溢れる飛び出す枯渇しないリビドー(Libido)」が消費されます。
これは非常に重要なポイントで、テクノロジーだけではいかんともしがたい「人間が人間たる要素のひとつ」が画像生成AIのシードとして使われていると考えることもできます。

担当編集ハセガワ氏の性癖に支えられる

ところで窓の杜での原稿は、担当編集ハセガワ氏の「性癖」に支えられて成立しているといっても過言ではありません。わたくしが普段研究開発で執筆している真面目なコンピュータサイエンスの論文や、商業書籍などの真面目さは求められていないです。むしろ、一般の方に向けて短い文章で「確実におもしろいな」と思える要素が求められます。またハセガワ氏は男子画像を華麗にスルー(しかも2-3回)するような「ちょっと偏った方」です。

何度指摘しても担当編集ハセガワ氏に華麗にスルーされる男子画像とプロンプト

一方では女子絵に関しては「えーそこまでガン振りしてもいいんですか?」というオトコノコならではの注文がいっぱい飛んできます。なかなか憎めない方であり、読者さんのことをよく理解しているからこそこのお仕事、このメディアを長く続けていける秘訣と感じます。


引用と紹介についての葛藤

何が善で何が悪かを線引きしない

正直なところ引用と紹介については葛藤がありました。商業メディアにおいて明確に法律に違反していない事項について、本連載では何が正しくて、何が問題なのかについては、「善だ悪だ」と決めることなく、どこかに強い線引きをするのでもなく、半年の連載の中で、その都度包み隠さず扱ってきました(知識のある方から「こんなことも知らんのか」というご意見をいただいたり、一方では毎週のように新しいサービスや常識のアップデートがあるので…)。例えば「コラム:“一線”を超えるとは…?」では海外のイラスト共有サイト「Danbooru」についてのお話しもさせていただきました。また今回の最終回も、一段とクオリティの高い萌え絵を描くためにデフォルトのモデルから「AnythingV4」というアニメ絵につよいモデルを追加する方法を紹介しています。

良質な動画を積極的に紹介する

また今回の取り組みとしては「テルルとロビン」さんの動画を紹介させていただいております。あらためて感謝を記させてください。連絡先が記載されていないのでご挨拶ができておりませんが、このブログを読んでいらっしゃいましたらぜひ感謝を伝えたいです。

最新のControlNet1.1についても超おすすめです

特に描き手の視点、超初心者の視点での解説が素晴らしい。

こういった良質な動画解説は今後の連載でも積極的に扱っていきたいと思います。書き手である私が保管する解説動画を作るとどうしてもオレオレ度が上がってしまいます。
「窓の杜」はYahoo!ニュース他にも配信されており、結構なビューになるはずなので「何でもかんでもオレが調べて書きました」としない工夫として、良質な動画を丁寧に検証してみる形をとっています。このような手法は動画だけでなくnoteのようなブログでも当てはまると考えます。

今後も「この動画/ブログは良質なのでぜひ紹介して」という情報やリクエストは歓迎です(基本は自分の足でめっちゃ調べています!!)。

世間の理解に対する調査もありがたい

また「AnythingV4」を商業メディアで扱うことについては若干の躊躇もありました。こちらの玉置さんの調査もありがたかったです。

あれはダメなんじゃないか、これはダメなんじゃないか、不快感を感じる、みたいなことは確かに考慮はするのですが、そのお気持ちを、「danbooru日利用モデル学習なら許せる」のか、「Waifu Diffusion学習ならあり」なのか、そもそも公式がLoRA配布することに不快感を感じるのか、など、多様な考え方を可視化しつつも「Anything学習のLoRAも気にならない」という方々もそこそこにいらっしゃること、世の中の理解や感想を試しながら推し量っていかないと、何でもかんでも闇に葬ることばかりしていてはいけないな、と思いました。

以上にて謝辞になります。

読者の感想も多様でいい

公開から一夜明けて、はてぶの様子を見に行きました。

賛否両論あっていいな、と思いました。

https://b.hatena.ne.jp/entry/s/forest.watch.impress.co.jp/docs/shseri/toolsd/1497610.html

「窓の杜」というメディアにおいては、WindowsPCをお仕事の効率化やホビーとして楽しむ、という原点に立ち返って楽しめている様子、そしてそこの楽しみ方は自由なんだなという原点が尊いと思いました。

カンブリア爆発の本質は「残る」

現在、生成AIはカンブリア爆発時代にいるのかもしれません。
という思わせぶりな書き方をしてしまいましたが、実はこれ、読み手の知識によってはいろんな解釈ができる表現なのです。
「カンブリア爆発」とは、古生代カンブリア紀の地層から、それより前の時代の地層からはほぼ見つからないような、複雑なからだや硬い殻・骨格をもつ生物の化石がたくさん発見されてきた話ですが、過去には「まさしく爆発的な進化が起きたことを示している」と考えられていました。しかしのちの遺伝子分析などにより、カンブリア爆発よりも前にそういった動物の大グループは出現していたことがわかっています。この時期にはむしろ、生物が一斉に殻などの硬い体構造を手に入れたため、化石に残りやすくなった結果、化石記録上では急激に進化が進んだように見えているのではないかという説も唱えられています。

つまり後の世の現代では「多様性が生まれた」と解釈されてしまいますが、「もともと多様で単に残りやすくなったから、化石として残り可視化された」という解釈もできるということです。

「窓の杜」のような長い歴史を持ったWebメディアの一端にAI画像生成のカオスな状況を少しでも残せたようであれば幸いです。

ここまで読んでいただきありがとうございました。
皆さんの初心者を捨てるきっかけになれたら、また素朴な感想をいただけるとありがたいです。
記事の最後に告知がある通り、新しい連載に向けて誠意準備中です。

またよろしくお願いいたします。 作家・しらいはかせ


この記事が気に入ったらサポートをしてみませんか?