見出し画像

AIグラビア発売終了?それより大事なのは?

AIグラビアの販売終了とのこと。まあ、自前で「モデル」(学習モデル)準備できない場合は、結構厳しかもねと思ったり。

私は、東南アジアで、30万枚以上写真撮っていますし、その半分は人物写真ですが、人物写真も今いる場所のがかなり増えているんで、いくらでも「許諾」取れますし(200〜300人程度)、さらに言えば、「合成を繰り返す」という手法を用いて、それらをLoRAとかHypernetworkとかではなく「学習モデル」そのものにマージしてしまえば、ま、独自のいろんなのを作れたりしますけど。

ええと、私が、なぜ、「みんなのフォトギャラリー」の<人物>の提供が多いのかを考えていただきたく。というのは、<人物>の項目、リアルなひとって実はほとんど居ませんよね。日本における「肖像権」などの関係もあって、アニメなら落書きならOKだけど、リアル人物を置くのは勇気がいると思います。たとえ著作権がフォトグラファーにあったとしても。

というのもあって、私は「つまらんな」と思ってたから(自ら、人物写真と風景写真を撮っていたのもあってか、既存のものを使おうとする気にもならず)、自分が撮影した写真を置くようにしたというわけです。そして、私が撮影した写真を何百枚と学習させて「合成すれば」(平均を取る、ということに数学的にはなるんでしょうけど)肖像権のまったく発生しない「学習モデル」になります。

例えば、

AI生成

この子は実在しません。私も誰だかわからん(笑)。

まあ、強いて言うなら、私が「かわいらしいな」と思った子供の写真(30マン枚のうち)50枚分くらいを合成したというか、<中間値>(平均)をとった、というような顔になっています。時々、(私は基本的に撮影した子の顔を覚えているんで)誰かを思い出しますが、それ以上でも以下でもないです。ってより、本人たち、いや、親すらわからんと思う。

・・私は勝手に「LaoNgaamちゃん」って命名してるけどね(笑)

一方で、実は同じLoRAや同じHypernetworkで生成可能なのですが、

AI生成(左下のSignatureが余計だな)

この子は、元となるモデルの子が存在します。まあ5年前の写真からってやつなので、大分成長しちゃってますけど、すでに。当時は、お気に入りのレストランのショーケース冷蔵庫によじ登ってバナナを必死に取ろうとしたりと、可愛らしい子供でした。

本人たちの顔で、本人たちに「いろんな衣装を着せて」「いろんな場所に連れて行って」「それらの画像/写真をプリントアウトして本人たちに差し上げる」ってことをやりたかったので、本人だとわかるようなものを作りたかったのですが、同時に(同じLoRAやHypernetworkで)その合成も作れるようにしていたというわけですね。
(そうなんです。いろんな実験の可能性を考慮していろんなのを詰め込んだり、それを複数作ったりしたので、何千枚と訓練済みなのです)



例えば、集英社さんが、今、真っ先にやらなければならないのは、

「独自の学習モデルづくり」

かなぁ、と思うのですよね。もし、こういうので危機感を持っていて、或いはビジネスチャンスだと思っているのならば。


今は、ジェネレーティブAIの「過渡期」だから、誰か特定のひとに似ている(Majiで恋する5秒前のヒロ*エとかそういう(違))というものじゃないと「評価されないんじゃないか」ということで、そういうのを作るひとが多いのだろうなとは思うのですが、やがては、
「今まで存在してなかったけれどみんながむちゃくちゃ愛してくれるような顔」ってのが作られるようになっていって(ってか、結局の所、ひとの「好み」とか「好き好き」って、反復して記憶してるか、みたいなところにあるんで、メディア(ミックス)で十分にそういう顔は「作れる」と思う。今後)、それらには肖像権はありません〜ので、って方向に向かうんじゃ?とは思ってたりします。

まあ、アニメキャラというかイラストなんかも同じかな。今は、「私の画風に似てる!」と言うひとが出てくるのも事実でしょうし、それもわからなくはないですが、既存のキャラクタ/テイスト/画風を「乗り越えた」万人受けするものが出てくるようになって、画風がどうしたと騒がれなくなるんじゃないのかしらね?っていうのが私が数年後を見据えたときの印象。

(まあ、いざとなれば、CC(クリエイティブコモンズ)のが量産されて、結局「囲い込む意味ないよね」って方向に行くと思われだは)


StableDiffusionの本質は「(もっともらしい)続きを描こうぜ」であり、ChatGPTの本質は「(もっともらしい)続きを書こうぜ」だったりするので、フラット化する社会においてAIがもたらすのは、独創性と同時にその中間地点に位置する「もっともらしいこと」の集合だろうとは思うわけですが。

人類が子孫を増やして頑張ったら100年くらいかかる「フラット化」をまあ1年くらいでやれるようになったのね、くらいな感じかな。今の段階では。

まあ、例えばですが、北海道民の「平均値」の美人さんたちの「生成された学習モデル」であるとか、いろんなのがオープンソース化しフラット化していくんだろうなと、オープンソース関連のイノヴェータでもあった私は思う。

GhostMixに「インスパイヤされて」出来た画像を、実写AI化してみた

例えば、これのオリジンの素材がなんだかわかりますか?

女性のカミュさん

聖闘士星矢の「カミュ」(アクエリアス)が、「オーロラエクスキューション」を放ってるシーンに「インスパイヤ」されて出来た実写風画像です。

「類似性」ってあります?(ありそうでないし、ないようで・・やっぱりない(笑))

つかまあ、原作者以外の誰かがイラストで書いたやつを「モチーフに」したと主張すればもう何も言いようがない。


ただ、たとえばこの「モデル」(学習モデル)に、ある程度生成物は「依存」しているのも事実です。学習モデルそのものは「画像」を保有していませんが、学習したベクトル(テンソル)は持ってる。何GBとかになってるけどね。

なので、繰り返しになるんですが、集英社さんやその他グラビア出版社(?)が真っ先に取り組むべきことは、オリジナルの「(学習)モデル」をつくる、というそのままです。だって、グラビア写真集には「グラビア"モデル"」が必要でしょ?(笑)

型(モデル)がなければ、量産できますまい。

結局の所、学習モデルがどのように(SDの場合は)「教師付きで」訓練したのか、によって、<呪文>は大きく変わるわけで、勿論、Danbooru / DeepbooruやWaifu14、CLIPといったので平均的にどのような呪文が出てくるのか(呪文が効果的か)、程度のことは覚えておく必要はあるけれど、それより先は、呪文の出し方に没頭するより、自前でモデルを構築しては?ということにはなりそうです。


風くん、この子と結婚したんですか、最後は・・w(四番目)(AI生成)

天文台で天体観測(?)(AI生成)

というわけで、東南アジアの写真集と合わせて、みんなのフォトギャラリーでの画像、よろしくおねがいします。m(_ _)m

(NG集のは、StableDiffusionを始めた頃、学びはじめの頃につくったやつだから、削除しちゃってもいいんですけどね・・)


以下は、本当の意味での実写版:


よろしければサポートお願いします! いただいたサポートはクリエイターとしての活動費に使わせていただきます!