見出し画像

AI推進派の中の倫理観に欠ける人々

※旧題は不評だったので、変更した。

近年のAIの進歩は凄まじい。技術革新と言っていいだろう。しかし、新しく広がった分野であるため、既存の部分との衝突もある。
その1つが著作権問題だ。

この記事は近年のAIと著作権に関する文化庁の素案とそれに対し寄せられたパブリックコメント、そしてそれに反応したnoteについて、私見を述べたものだ。意見誘導される方が多いので、つい書いてしまった。
少々長くなってしまったが、最後まで読んで頂けるとありがたい。

文化庁のPDFのリンク:「AIと著作権に関する考え方について(素案)」に関するパブリックコメントの結果について

それに触れたnote。

おまけ:資料のある文化庁ページ



私の立場

さて、本題に入る前に、私の立場を表明しておこう。
私はAI慎重派だ。引用のnoteにあるような、反AIと括られた規制派にも含まれると言っていい。

詳しく言えば、私は技術革新には賛成だし、AIによる発展・社会の進化に期待を寄せている。また、本業の方でも生成AIが導入され始めているので、身近でもある。

しかし、「新事業分野であるにも関わらず既存の法律・解釈をそのまま適用すれば良いと思考停止し、諸手を挙げて歓迎する」ことはできない

社会人として、権利や法律の遵守は当然のことであり、また、著作権侵害か否かは業務に関わる重要なことだからだ。

適切に事象を分析すべきであり、法整備が必要だと考えている。
また、開発・学習側の技術者倫理や、生成AIサービス提供者としての法的責任を果たすことが大切だ。

法律的な観点

著作権とツールと言えば、私の中では特にWinny事件が記憶に残っている。あれは裁判で最終的に配布側は無罪になったが、利用側には著作権違法で逮捕された者もいた。生成AIの利用者の逮捕も無いとは言い切れない。

著作権法は人だけが創作するという前提で制定されている。そのため、生成AIというツールによる創作が出てきたことで、改正されてもおかしくはない。

基本的に、法律が公布される前の事象には法の不遡及が適用される。
もちろん、新・著作権法が公布されるのであれば、それ以前は罪に問われない。しかしながら、既存の著作権法の解釈が変わるだけならば、遡及して生成AI使用者に著作権法違反が適用されることは十分ありうるのではないだろうか?

条文追加や新法になるのか、それとも解釈が変わるのか。
いちAI利用者としては注意したいところだ。

本題、パブリックコメントについて

さて、本題に入ろう。

引用したnoteだが印象操作的であり、反AIと一括りにしたうえで規制派・慎重派全体を貶めている。
反論したい事が複数あるので、引用元で述べられている順に挙げていこう。

パブリックコメントとその性質

日本においては「意見公募手続き」とも呼ばれるパブコメ。

パブリックコメントとは、公的な機関が規則あるいは命令などの類のものを制定しようとするときに、広く公に(=パブリック)、意見・情報・改善案など(=コメント)を求める手続きをいう。公的な機関が規則などを定める前に、その影響が及ぶ対象者などの意見を事前に聴取し、その結果を反映させることによって、よりよい行政を目指すものである。通称パブコメ

パブリックコメント/ Wikipedia

今回はAIと著作権について議論しよう、ということだ。

ここで、引用のnoteが述べていることをまとめてみた。

  1. AIを規制すべき論を送るべきなのに、コメントの多くは感情にまかせたお気持ち表明だった

  2. 数を送れば良いわけじゃない

  3. 文化庁の回答は「既存の法律で裁ける範囲」「今回は関係ない話」「認識が間違っている」

1について訂正してあげるならば、「どこが問題点で、どう対処すべきか、という論理的な持論を送るべき」だろう。

さて、1や2は確かに正しい。
理由付けして意見を送らなければ議論にならないし、多数決で決まるわけでもない。その点では、引用のnoteの論調は正しいと言っていいだろう。

しかし、ほとんどが3で占められていた、という発言はどうだろうか?

上述の文化庁のpdfには、個人意見が78件あった。
その意見を全て分析したところ、私がパブリックコメントとして不適切だと認識した意見は15件あった。以下に内訳を書く。

[ 意見No ]
理由なし
:11、19、20、83、254、306、369
"本考え方"に関係なし
:19、20、54、55、56、60、63、64、65、77、83

"本考え方"は文化庁pdfの文言より

理由がなく、議論になっていないのは7件。
「AIと著作権」に関係ないのは11件(「既存の法律で裁ける範囲」も含む)。

「認識が間違っている」はカウントしなかった。
これは法解釈の問題や、既存法をそのまま当てはめて良いか、新設すべきではないかという議論点が含まれるからであり、パブリックコメントとしては必要だからだ。

よって、78件中、適切に寄せられたと思われるコメントは63件で、その比率は80.76%だ。
私の見方では、有用なコメントの割合が多かった。
なお、

  • 「〜なので」「〜のため」以外でも、事由を述べているものを含めている

  • コメントは事務局が概要に圧縮しているため判断材料として適切だと言い切れない

  • 同じ意見が1つにまとめられたために、63/78という比率が元の比率ではないと思われる(有用、対象外のどちらも)

  • 組織と個人の意見がダブった際に、どちらの表記が優先されるかは知らない

という点に留意してほしい。

結局のところ、個人パブコメの有用性の比率は、引用元のnoteが示したpdfからは断言できないのだ。

全ては個人パブコメが全公開されてから判明する。
ひょっとして断言できた引用元note投稿者は、大量パブコメに対応するために奔走させられた文化庁職員なのか?

全てのリンクがある文化庁のページはこちらから


引用元noteのケース1と2について

さて、次に移ろう。
・ケース1:現在の盗作・嫌がらせ被害
・ケース2:児童ポルノ禁止について
は、引用元noteが正しかった。
現行法で対処できるものだったため、飛ばす。

なお、ケース1について、文化庁pdfの説明では対応しきれないと考えられる例をご存知の方は、次のパブコメとして送るか、pdfにあるように文化庁の窓口まで報告・被害者の案内を。


ケース3 AIは既存著作物の切り貼りか否か

引用元noteでは、
・No.88「生成AIの多くは事実上切り貼りではないか」
・No.281「複製物でない根拠が明示されてない」
に触れ、コラージュでもないと言っている。
これは正しい。

No.88について
切り貼りやコラージュではないことは確かだ。
著作権物からそのまま切り出して張り合わせたものではない。もし仮にそうであったとしても、著作物と完全一致するのは数pxの極小の範囲になり、著作権法の適用は認められないだろう。

No.281について
複製という言葉を使ってしまうと、著作物と完全一致することを指す。
そのため、著作物とpx単位で比較することになり、全て一致しなければ法的に複製とはみなせないだろう。

逆に類似という言葉を使えば、どこまでが類似か、どこまでが著作権で保護される範囲かを指すため、著作権の議論が必要になるだろう。著作権法のどこをどう変えるべきだ、という具体的な論がパブコメにふさわしい。

ただ、根拠を明示すべき、というのは大事な点だ
近年では東京五輪のエンブレムも、盗作疑惑が持ち上がった。人が作成したものでさえ、盗作でないと根拠を明示できることが重要だったのだ。
学習データ内に含んでない、あるいは〇〇という数値的に類似ではないと言い張れる根拠を生成AIの商用側は提示できるべきだ、と私は考える。

補足

一応、生成AIの本質に触れておこう。
大雑把に言えば、基本的に学習データの統計を学習している。

統計とは何か?
言い換えると共通要素といえば分かりやすいかもしれない。
その共通する部分を、明示しにくい形で記憶できるのだ。

学習データ全体をクラスタリングすると、大雑把な分類ができるだろう。
さらにデータ1つ1つに注目すると、構成部品・パーツ単位で分類できる。
分類のレベルを小さくしていくと、最後にはデータを構成する最小単位で分類できる。
その各レベルにおいて、集団の共通部分を特徴として学習している。

画像で例えれば、最初のグループは風景画、肖像画かもしれない。
次の構成部品は、画像に含まれる人や動物の形、物体の形かもしれない。
最後の方の小さい構成部品は、表情や手の形、指の形、材質などかもしない。
画風は全体的な要素なので、全てに影響しているだろう。

そこに入力値という方向性(=プロンプト)やランダム性を加えて、生成するのだ。他にもいろいろな能力があるが、省かせてもらう。

よって、切り貼りではないと断言できる。
(だからこそ、学習に用いた画像とほぼ同じ画像が出力された事例には驚いた。いくらLoRAの様な手法で近付けられるといえど、依拠しすぎである。)

もちろん、定義次第によっては盗作と主張できる。特にi2iの画風変換は元画像が無ければ生成できないので、依拠していると断言できる。


引用noteでの"反AIフローチャート"

次に述べられていた反AIフローチャートに話を移そう。

"1. 生成AIを使うこと自体が悪いことである。" "答えはNO"

引用元noteでは「生成AIに触れていない人は居ないし、AI加工禁止にすると絵描きに問題が起こる」という非論理的な議論をしているが、結論は正しい。
悪いのは、問題がある生成AIを配布している配布元と、悪用する人間である。

絵描きのAI加工を禁止しても、その絵描きが更に技術力を付ければ良いだけの話で、大した問題じゃない。
著作権法の方が大事だ。

なお、引用元noteで触れられていたclip studioのAI機能だが、対象ページには古典的アルゴリズムによる数式処理(非ディープラーニング)と、生成AIを使った処理の2通りが含まれている(と思われる)。一口にAIと言っても、「古典的な弱いAI」から「強いAIに近づいてきた生成AI」まで様々なものがあるのだ。

サーバにアップロードする必要のある機能(トーン消去、自動彩色、ポーズ読み取り)が生成AIだと思われる。私はクリスタを使用したことが無いので分からないが、自動彩色は高精度でやるなら生成AIが適切だと考えられる。
また、データセットに含まれる多種多様だろう。


"2. 無断で学習することが悪いことである" "答えはNo"

これも結論は正しい。
人が技術向上のために、他人のものを無断で学習することはあるだろう。
現行法での著作権侵害の範囲にあたらない。
引用元noteの論である「模倣の精度」は論点にはならない。

ではAIが無断で学習するのは良いのか?
良い。学習に限っては。好きなだけ生成AIの研究をすると良い。

ただし、商用化は不可。「生成物の著作権の主張も不可。少なくとも、生成者にその権利は無い。理由は著作物を許諾なしに利用しているからだ。
詳細は後述する(最後の「個人的な感想」の章)。


"3. 侵害者に比べて被害者の労が大きいのが悪いことである。" "答えはNo"

被害者は苦労してて、加害者は苦労してないのに事故が起こる、というのは現実でよくあることだ。加害者・被害者間の労力の多寡バランスは問題ではない。
そのため、Noは正しい。

しかし、他の要素が絡むと「被害者の方の労が大きい」ことは問題となり、Yesとなる。
その要素とは、著作権侵害のスピードと裁判所の業務量だ。

例えば、人が1枚のハイクオリティな絵を描くのには1時間以上かかる。Aの絵をBがパクるとしても、1時間以上かかった。それが生成AIを使えば、最低でも1分で1枚は生成できるだろう。

単純計算で、著作権侵害のスピードは60倍以上になりうる
それも1人の使用者によって。複数人で行われれば対応などできなくなり、著作権者は常に対応に追われることとなる。

それに加え、裁判所のキャパシティが問題となる。
著作権侵害について訴えることができるのは地方裁判所だ。

しかし、地方裁判所は、ネットで多発する情報開示請求も対応する。場所によっては非常に大量の開示請求があるため、他の業務に支障をきたしている地裁もある(少し調べれば出てくるだろう)。

それを事前に防ぐように求めているのが現状だ。
予防しないなど、到底ありえない。

引用元noteは、反AIが
・"国が自動的に罰を下して"
・"審議を経ずに即断"
・"国が創作物を常に監視"
と主張していると言うが、規制派・慎重派全員がそのように言った根拠を示すべきだ。

侵害者に比べて被害者の労が大きい云々よりも、そもそも著作権侵害物を生成できないようにすれば良いだけの話だ。


"4. AIには"愛"がない。"温もり"がないのが悪いことである。" "答えはNo"

引用元noteは乱文で意味不明だったのだが、どうやらこう言いたいらしい。
「生成AIの創作物は学習元の二次創作です。でも生成AIに関わらず、二次創作は著作権侵害なので許されません。愛が有っても無くてもだめです」

まず、二次創作は著作権侵害か、次に生成AIの生成物が二次創作物にあたるか、最後に生成AIの二次創作物が著作権侵害にあたるかの3段階に分けて議論すべきだ。

二次創作は著作権侵害か?
二次創作は一般的に、人が「原典となる創作物を利用して派生作品を作ること」だ。そして、二次創作物には著作権侵害が認められるものとそうでないものが存在する。この時点で引用元は間違っている。

著作物の同一性保持権、翻案権などを侵害した場合、著作権法違反となる。
ただし、著作者が二次創作をある程度許容していることもある。これは同一性保持がなされている、という認識になる。

また、著作権法違反は親告罪であるため、著作者が訴えない限り訴訟にはならない。訴訟になっていなくとも、著作者から回収を求められた場合には二次創作物を回収すべきである。

また、著作者が著作権侵害の二次創作物認識していない場合、罪には問われないことになる。さらに、著作権侵害となる二次創作物を作成しても個人的使用の範囲に留めて公開しなければ、実質的には著作権侵害とカウントされない。
二次創作の著作権侵害の是非については、生成AIとは別で問うべきことだ。

次に、生成AIの生成物が二次創作物にあたるかどうか。
引用元noteは生成AIの生成物は二次創作物だと言っている。
ならば、現状においては頒布は許可され、商用利用は禁止されるのだろう。
それか、生成AIの二次創作の扱いを新規に制定するよう、議論すべきだ。

二次創作でないなら?
それは一次創作物の複製か、別の一次創作物とカテゴライズされるものとなる。AI生成者が複製の著作権を主張するなら著作権侵害だ。
別の一次創作物として認められるには、著作物の必要条件をクリアしなければならない。(当然、引用元の二次創作であるという条件に反する)

最後に、生成AIの二次創作物が著作権侵害にあたるかどうか。
これは生成AIの仕組みによるだろう。物によってはOKな生成AIもあるかもしれないし、i2iの画風変換のように、完全に元の著作物に依存している処理もある。著作物への依拠が認められば、当然著作権侵害だ。

注意してほしいのは、複数段階の著作権侵害が発生しうることだ。
まず、生成AIというツール自体に著作物が用いられているので著作権侵害であること。次に、生成AIからの生成物に学習した著作物の依拠がありうること。最後に、生成AI使用者が二次創作物の著作権を主張し、一次創作者の著作権を侵害しうること。

人による二次創作と生成AIを用いての二次創作は、同一視してはならない。


"5. AI化によって人力で絵を描く仕事を奪うことが悪いことだ" "答えはNO"

"便利になることで仕事が奪われることは悪ではありません。"

これは非常に難しい問題だ。
簡単な結論は出ないし、短絡的に結論しようとも思わない。
引用元noteでも触れられているように、産業革命などでは多くの失業者が発生した。失業者のその後がどうだったかは、定かではない。

ただ、AIに仕事を奪われることは善でもない
引用元noteの論説に従うならば、自明な成り行きであるだけだ。

ただ、気になる点がある。
イラストレーターなどの著作者は不足しているのだろうか?
嫌な言い方をすれば、イラストレーターは腐る程居る。
社会の需要は満たされている方が多いのではないか?

イラストレーター以外の、他の業界はどうだろうか?
本当にニーズはあるのか?
既存の人に依頼すれば十分ではないか?
ニーズがあるなら、業界から諸手を挙げて歓迎される
のではないか?

ないならば、個人的な需要だけが存在する。
社会に公開しない範囲での、プライベートで好き勝手すれば良いだろう。


"反AIの本当の主張"について

面倒なので、丸々引用。

反AIの言説を纏めてみましょう。
・自分が他者の著作物を利用し、二次創作やミーム遊びをする。
 これは許されるべきである。愛は著作権よりも強い。

・自分の著作物が他者のAIによって模倣される。
 これは許容できない。

・自分の著作物が他者の人の手によって模倣される。
 これは愛を感じる限り許容する。著作権は親告罪である。

・他人の著作物が他者のAIによって模倣される。
 これも許容できない。(←!?)自分が被害に会ったわけではないが罪に問われるべきである。

引用元note

"反AIが重要視しているのは愛と労力"

全然分かっていない。

  • 「生成AIと著作権」、「著作権と二次創作」は別の問題

  • 生成AIによる模倣は許容できない

    • 模倣しても良いが、学習や生成に非許諾者の著作物を使うな。著作権の侵害だ

  • 人による模倣は許容できる

    • 引用元noteの「愛がある」= 悪意はない状態

    • 悪意があれば著作権法を適用する

また、

  • 生成AIの能力と、生成AIを使用する者の能力を同一視している

    • 生成AIそのものの議論」「使用者についての議論」は別である

    • 引用元の「労力をかけていない」=プロンプト入力は制作ではない

    • クリエイターが嫌うのは、自身が制作していないものを自身の制作物と主張すること

      • さらに、それに自他の著作物が不当に使われていること

  • そもそも生成AIに嫌悪感がでたのは、生成AIを悪用する人間が問題を起こす上に声がデカいからだ


個人的な感想

後ろの方の感想は個人の感想の範囲であるため、触れない。
また、挙げられている法律は以前作られたものであり、議論の余地しかない。詳しくは下の著作権法解釈で述べる。
子供の駄々みたいな文ばかりで解読に疲れてしまった。

文化庁のpdfを見て思ったが、パブコメは役割を果たせている

当然、議論になっていないものは除く必要があり、条件にあった意見を送らなければならない
しかし、法の整備には、多角的、客観的な視点が必要だ。誰かが送り損ねた問題点を、別の誰かは送っているかもしれない。大人数で議論・評価することは重要なのだ。

なあなあで済まされるより、多人数が着目したほうが良い。
X(旧Twitter)の推薦アルゴリズム的にもそうだ。

著作権法の解釈について

文化庁の事務局の対応だが、2万件という多くのコメントについて対応に奔走したためか、回答がコピペだらけだった。
その片手落ちのコピペにケチを付けるわけではないが、ただAI前の著作権を当てはめようとするだけの機械のようだった。

AI前後で著作権の解釈を変えるべきなのか、条文追加をしての対応とするのか、そもそも著作権法を作り変えるのか、AIに著作権を認めずフリー素材として例外扱いするのか。
様々な選択肢があるはずだ。その1つ1つを詳細に検討すべきである。

また、事務局は、現時点での生成AIの能力に固定された判断をしている。
学習データに著作物が含まれており、その使用を禁止されると何もできないではないか?と。だが、少なくとも著作権の課題が持ち上がり、クリアできていない現在、認めるべきではないのだ。

学習データに含まないこと

そもそもの話である。
現在の生成AIは、膨大なデータを超巨大なモデルで学習させている。
この膨大なデータというのがミソで、それを作成する現実的な手段は「ネット上での収集」となる。

例えば、Aさんに似た作風で生成させるには、Aさんの著作物を学習データに含まなくとも、Aさんに似た作風のBさんCさんDさん…という膨大なデータ、更にはその分野の他の作風の膨大なデータが必要なのだ。全ての著作権者が学習データに含むなと言えば、何もできない。
だから「学習データに含むな!」と言うと過激なAI推進派は困るのだ。

では、学習データに含む用の作品を制作して、という依頼が来たとしよう。
その依頼の報酬がその作者の一生分の稼ぎでなければ、受けないのではないか?
AIサービス提供側は困るだろう。
数万人以上の生涯分の報酬は現実的に払えない。

では、ゴミクズだけを大量に作成して、学習すればどうなるか?
生成されるのはゴミクズだけだ。

これは現在のAIが抱えるジレンマだ。
著作者の課題にすべきではない。AIサービス開発者の課題なのだ。
生成AIのサービス化・商用化ありきで法律を解釈してはならない。

「このレベルのことができるようになるまで、著作権を認めるべきではない」という基準が設けられて良いはずだ。
「生成AIの生成物は必ず独創性が無ければならない」など。
それを満たせるように、生成AIサービス提供側は研究開発をすべきではないか?

AIサービス提供側は

企業としては資金面で苦しいだろうが、有力な新製品の発売までに莫大な開発費、長い開発期間がかかるのは当然だ。

産業を保護してほしいなら、国に開発補助を設けてもらうべきだ。
あるいは、世界のトップであることを明確な証拠と共に提示して、投資家などに出資してもらうべきだ。

そうでないなら、他人の上前をはねるだけで美味い思いをしたいだけの無能でしかない。学習データに含まれる作品の著作者と同じように、正しい努力をすべきだ。

製品開発において

そもそも、古くからの製品開発において、他人の著作物を勝手に組み込むことがあっただろうか?
特許などであれば、使用料を払うのが常だ。
当然、商用ツールは法律的な問題をクリアして販売される

そのため、生成AIの学習フェーズのみであっても、非許諾の著作物利用は著作権法に反している、と考えるのは自然な流れだ。
そうでないと思うならば、学習時の著作物組み込みの是非や、学習データの透明性について議論すべきだ。

AI推進派に潜む、悪質で倫理観の欠如した者達

さて、ここまで問題を見てきて感じたのだが、やっきになって生成AIを推進しようとしている人間は、生成AIの研究者やAIサービス開発者ではない。
企業倫理の無い、生成AIの利用者だ。

悪質なAI推進派が嫌われる理由は、正にここにある。
盗作、なりすまし、誹謗中傷などを平気で行う者達である。

なお、先述の生成AIサービス提供側についての責任の話は、個人的に生成AIを学習させている者にも置き換えできる
他人の著作物を無許可に使用したもので、金を稼いではならない。上記の解釈が適用されれば著作権法違反だ。

パブコメとその回答への私の反応

さて、以下には私が意見したいと思った個人意見(コメント)と回答を、要約して載せている。詳しくは元のpdf(当note上部)参考。

なお、諸事情により私個人ではパブコメを送らない(送れない)。
以下の意見をパブコメとして送るのは自由であり、引用の形式を取らなくてよいし、改変しても良い。ただ、私の意見以外の部分(引用元の質問や回答)を用いる際はちゃんと引用元から引用することが望ましいだろう。


No.306:AI生成物に限り著作物との類似性を広く認めるべきでは?
回答:"本質的特徴を直接感得できるかといったこれまでの判例上の観点から、裁判所が個別具体的な事案に応じて判断"

この点について、裁判所がAI前とAI後で判例を適切に切り分けて見ることができるのだろうか?
裁判所の裁量範囲が大きすぎるのではないかと感じる。
あるいは、裁判所の判断材料とすべく、曖昧になっているAI事例の本質的特徴の直接感得の具体例についても議論すべきでは


No.326:依拠性の判断には、該当データの出力物への影響量などを踏まえ、個別具体的に判断すべき
回答:"本考え方では、AI生成物に既存の著作物との類似性が認められる場合を前提にしつつ、当該既存の著作物がAI学習用データに含まれている場合でも、依拠性が否定される場合があり得るとする考えが示されています。"

回答になっていない。
「生成中のモデルのパラメータを分析し、学習データ中の著作物からの影響量を数値的に計算し、何らかのしきい値で判断する方法」も、依拠性の判断材料の1つとして採用可能か、また、数値的な判断方法を新設できるのかを議論すべきではないか?


No.359:事業者が著作権侵害の責任 ← AI生成システムが既存著作物を出力しないのは実質的に不可能。「事業者が侵害の責任主体」は反対
回答:本考え方では当事者は法的リスクを把握するべきものとしている。主体は、判例などに照らし合わせて裁判所が判断する。ここには既存の判断要素を載せておいただけ

商用利用者が逃げようとするな。
責任をとれ。


この記事が気に入ったらサポートをしてみませんか?