見出し画像

Adobe Firefly がクリーンではないと言われる理由

画像生成AI技術がありふれたものに変わり、最近では拒否反応のようなAI画像はすべて盗作だとする極論的な論調は少なくなってきました。それでも、企業はAIモデルや学習時の「クリーン」さを強調する必要性に迫られています。

企業がクリーンさを強調する手法の一つで、最大手 Adobe がAI技術に参入した際に取ったものは、自社の画像ライブラリのみで学習するというものです。確かに自社で所有する画像であれば、(許諾を取っていない)著作物を学習するリスクはないのではと考えるかもしれません。しかし、4つ落とし穴があります。

  1. 画像提供者が過失や嘘で他人の著作物を登録している

  2. 写り込み

  3. Midjourney 等のAIで生成したもの

  4. 単語と画像を結びつける学習の際に、著作物ありで学習したAI技術を利用している

1は何にでも言える事ですが、Google検索に違法なリンク(個人サイトならしょっぴかれる)が表示されてもGoogleは逮捕されないような責任転嫁手法と言えます。

2は写真では仕方がないものです。写真の権利には写り込みの免責がありますが、AIで学習する際は関係ありません。写り込みもすべてAIが学習します。ピカチュウのシャツを着ている人物の写真があれば、ちゃんとピカチュウを隅々まで学習します。さらに背景の人物の肖像権をすべてクリアする事なんて不可能です。

3は間接的に著作物を学習している事になります。著作物由来の情報をネットワークの重みの形で渡すか、その重みをピクセル空間として渡すかの違いしかありません。

4は、たとえばピカチュウのシャツを「ピカチュウ」として認できるのは、(著作物で学習したTransformerの)学習データを間接的に利用しているからです。つまり3と同じ話です。これは言葉だけの話ではありません。ネットワークの内積空間を決める事になるので、Adobe ライブラリにない著作物を生成できる可能性もゼロではありません。                                                                                                                                                                             

もちろん法律の話ではないので、法的には別の解釈になるのかもしれませんが、「クリーン」な学習はあり得ない・ほぼ不可能に近い程難しいという話でした。

※ Adobe が Sora を利用するとかしないとかの話がありますが、Sora は YouTube を規約違反で利用していると騒がれているぐらいです。クリーンイメージ戦略を変更するのでしょうか。


この記事が気に入ったらサポートをしてみませんか?