見出し画像

文化庁パブコメに向けた「AI と著作権に関する考え方について(素案)」の論点整理~【著作権者の利益を不当に害することとなる場合について】

この記事は自分のホームページに掲載された内容を周知目的で改変し転載しました。


前回の続き

 文化庁パブコメに向けた「AI と著作権に関する考え方について(素案)」の論点整理~【 「非享受目的」に該当する場合について】

 文化庁が「「AIと著作権に関する考え方について(素案)」に関する意見募集の実施について」というパブリックコメントを行っているため

 そのパブコメを送るための「AI と著作権に関する考え方について(素案)」の論点整理を行うための論点整理を目的としてコラムを書きました。

 筆者は締切日2024年2月12日ギリギリまで粘ってパブコメの内容を考えることにします。

 なお筆者は法の専門家ではなく、あくまで自身のパブコメのために資料を理解するためにこのコラムを執筆したにすぎませことは了承して下さい。

 とりあえず、資料の中でも自分が注目している部分だけピックアップしています。また検索拡張生成(RAG)に関しては自身の知識不足なため意図的に省いています。

エ 著作権者の利益を不当に害することとなる場合の具体例について

(ア)法第 30 条の4ただし書の解釈に関する考え方について

○ 法第 30 条の4においては、そのただし書において「当該著作物の種類及び用途並びに当該利用の態様に照らし著作権者の利益を不当に害することとなる場合は、この限りでない。」と規定し、これに該当する場合は同条が適用されないこととされている。
○ この点に関して、本ただし書は、法第 30 条の4本文に規定する「当該著作物に表現された思想又は感情を自ら享受し又は他人に享受させることを目的としない場合」に該当する場合にその適用可否が問題となるものであることを前提に、その該当性を検討することが必要と考えられる。

文化庁「「AIと著作権に関する考え方について(素案)」


第九条 〔複製権〕
(1) 文学的及び美術的著作物の著作者でこの条約によつて保護されるものは、それらの著作物の複製(その方法及び形式のいかんを問わない。)を許諾する排他的権利を享有する。
(2) 特別の場合について(1)の著作物の複製を認める権能は、同盟国の立法に留保される。ただし、そのような複製が当該著作物の通常の利用を妨げず、かつ、その著作者の正当な利益を不当に害しないことを条件とする。
(3) 録音及び録画は、この条約の適用上、複製とみなす。

文学的及び美術的著作物の保護に関するベルヌ条約パリ改正条約(抄)


第十条 制限及び例外
(1) 締約国は、著作物の通常の利用を妨げず、かつ、著作者の正当な利益を不当に害しない特別な場合には、この条約に基づいて文学的及び美術的著作物の著作者に与えられる権利の制限又は例外を国内法令において定めることができる。
(2) ベルヌ条約を適用するに当たり、締約国は、同条約に定める権利の制限又は例外を、著作物の通常の利用を妨げず、かつ、著作者の正当な利益を不当に害しない特別な場合に限定する。

著作権に関する世界知的所有権機関条約


第13条 制限及び例外
加盟国は,排他的権利の制限又は例外を著作物の通常の利用を妨げず,かつ,権利者の正当な利益を不当に害しない特別な場合に限定する。

TRIPS協定

第十条 制限及び例外
(1)締約国は、著作物の通常の利用を妨げず、かつ、著作者の正当な利益を不当に害しない特別な場合には、この条約に基づいて文学的及び美術的著作物の著作者に与えられる権利の制限又は例外を国内法令において定めることができる。
(2)ベルヌ条約を適用するに当たり、締約国は、同条約に定める権利の制限又は例外を、著作物の通常の利用を妨げず、かつ、著作者の正当な利益を不当に害しない特別な場合に限定する。

著作権に関する世界知的所有権機関条約

ベルヌ条約等では権利制限を設けるにあたり

・特別の場合

・著作物の通常の利用を妨げず

・著作者の正当な利益を不当に害しない

といった3ステップ・テストを設定しています。

法30条の4の但し書きの「当該著作物の種類及び用途並びに当該利用の態様に照らし著作権者の利益を不当に害することとなる場合は、この限りでない。」の内容はこの3ステップ・テストの1つである「その著作者の正当な利益を不当に害しないこと」に該当します。

○ また、本ただし書への該当性を検討するに当たっては、著作権者の著作物の利用市場と衝突するか、あるいは将来における著作物の潜在的販路を阻害するかという観点から、技術の進展や、著作物の利用態様の変化といった諸般の事情を総合的に考慮して検討することが必要と考えられる 17 18。

文化庁「「AIと著作権に関する考え方について(素案)」

法第30条の4ただし書では,「著作権者の利益を不当に害することとなる場合」には,権利制限が適用されないことを定めているところ,当該場合に該当するか否かは,同様のただし書を置いている他の権利制限規定(法第35条第1項等)と同様に,著作権者の著作物の利用市場と衝突するか,あるいは将来における著作物の潜在的市場を阻害するかという観点から判断されることになる。

令和元年10月24日,文化庁著作権課,デジタル化・ネットワーク化の進展に対応した柔軟な権利制限規定に関する基本的な考え方(著作権法第30条の4,第47条の4及び第47条の5関係)

法30条の4は法35条の1項等の権利制限と同様に「著作権者の著作物の利用市場と衝突するか,あるいは将来における著作物の潜在的市場を阻害するかという観点から判断されることになる。」という観点から判断されることが明言されています。

ここで言う35条1項とは

学校その他の教育機関(営利を目的として設置されているものを除く。)において教育を担任する者及び授業を受ける者は、その授業の過程における利用に供することを目的とする場合には、その必要と認められる限度において、公表された著作物を複製し、若しくは公衆送信(自動公衆送信の場合にあつては、送信可能化を含む。以下この条において同じ。)を行い、又は公表された著作物であつて公衆送信されるものを受信装置を用いて公に伝達することができる。ただし、当該著作物の種類及び用途並びに当該複製の部数及び当該複製、公衆送信又は伝達の態様に照らし著作権者の利益を不当に害することとなる場合は、この限りでない。

第三十五条 学校その他の教育機関における複製等

法35条1項の但し書きは法30条の4と違って細かく該当例が載っています

2020 年 4 月 16 日,改正著作権法第35条運用指針(令和 2(2020)年度版).著作物の教育利用に関する関係者フォーラム,⑨ 「著作権者の利益を不当に害することとなる場合」

17 本ただし書は、法第 30 条の 4 により権利制限の対象となる行為が、特定の場面に限らず「著作物に表現された思想又は感情を自ら享受し又は他人に享受させることを目的としない場合」を広く権利制限の対象とするものであり、柔軟性の高い規定となっていること、技術の進展等により、現在想定されない新たな利用態様が現れる可能性もあること、著作物の利用市場も様々存在することから、同条の権利制限の対象となる行為によって著作権者の利益が不当に害されることがないよう定めているもの(加戸守行『著作権法逐条講義 七訂新版』(公益社団法人著作権情報センター、2021 年)284 頁参照)とされている。
18 この点に関して、改正前の旧法第 47 条の7において権利制限の対象であった行為(例:電子計算機による情報解析のための記録媒体への記録)については、同条ただし書が「情報解析を行う者の用に供するために作成されたデータベースの著作物については、この限りでない。」と限定的に規定しており、改正前に「権利制限の対象として想定されていた行為については引き続き権利制限の対象とする立法趣旨」(参議院文教科学委員会附帯決議(平成 30 年5月 17 日))に鑑みれば、このような行為について、改正後の法第 30 条の4柱書ただし書に該当するのは、情報解析を行う者の用に供するために作成されたデータベースの著作物の場合に限定される、といった意見があった。

文化庁「「AIと著作権に関する考え方について(素案)」

著作物は、電子計算機による情報解析(多数の著作物その他の大量の情報から、当該情報を構成する言語、音、影像その他の要素に係る情報を抽出し、比較、分類その他の統計的な解析を行うことをいう。以下この条において同じ。)を行うことを目的とする場合には、必要と認められる限度において、記録媒体への記録又は翻案(これにより創作した二次的著作物の記録を含む。)を行うことができる。ただし、情報解析を行う者の用に供するために作成されたデータベースの著作物については、この限りでない。

旧法47条の7  電子計算機による情報解析のための複製等

平成21年度改正著作権法において旧法47条の7 「電子計算機による情報解析のための複製等」が追加されそこから10年の時を経て、現在の「著作物に表現された思想又は感情の享受を目的としない利用」が制定されました。

 法30条の4の但し書きはこの「電子計算機による情報解析のための複製等」の但し書き「ただし、情報解析を行う者の用に供するために作成されたデータベースの著作物については、この限りでない。」を引き継いでいます。


この点については、権利制限の根拠を情報解析の公益性に求めた場合であっても、契約によって入手可能なデータベース等の場合には権利制限を認める必要はないとの意見があった。このような意見に照らせば、既存のビジネスの中で研究開発に必要なデータベース等が有償で提供されているような場合、その他、著作物の性質や利用態様等に応じて著作権者等の利益を害すると考えられるような場合には、権利制限の対象外とすることが適当と考えられる。

平成21年1月,文化審議会著作権分科会,文化審議会著作権分科会報告書


(イ)アイデア等が類似するにとどまるものが大量に生成されることについて

○ 本ただし書において「当該著作物の」と規定されているように、著作権者の利益を不当に害することとなるか否かは、法第 30 条の4に基づいて利用される当該著作物について判断されるべきものと考えられる。
(例)AI 学習のための学習データとして複製等された著作物
○ 作風や画風といったアイデア等が類似するにとどまり、既存の著作物との類似性が認められない生成物は、これを生成・利用したとしても、既存の著作物との関係で著作権侵害とはならない。
○ 著作権法が保護する利益でないアイデア等が類似するにとどまるものが大量に生成されることにより、特定のクリエイターの市場が経済的に圧迫される事態が生じることは想定しうるものの、当該生成物が学習元著作物の創作的表現と共通しない場合には、著作権法上の「著作権者の利益を不当に害することとなる場合」には該当しないと考えられる。
○ なお、この点に関しては、アイデアと創作的表現との区別は、具体的事案に応じてケースバイケースで判断されるものであり、上記イ(イ)のとおり、特定のクリエイターの作品である著作物のみを学習データとして追加的な学習を行う場合、当該作品群が、当該クリエイターの作風を共通して有している場合については、これにとどまらず、表現のレベルにおいても、当該作品群には、これに共通する表現上の本質的特徴があると評価できる場合もあると考えられることに配意すべきである 19。

文化庁「「AIと著作権に関する考え方について(素案)」

アイデアと表現の二分論は前回記述しましたので省略します。→【 「非享受目的」に該当する場合について】

作風や画風などの著作権法が保護する利益でないアイデア等が類似しているにすぎない状態では例え特定クリエイターの市場を圧迫する事態になっても但し書きに該当することは無いことを明記しています。

ただし、創作的表現が一致している場合もあることに配慮するべきであることを呼び掛けています(ここらへん抽象的)

19 また、アイデア等が類似するにとどまるものが大量に生成されること等の事情が、法第30 条の4との関係で「著作権者の利益を不当に害することとなる場合」には該当しないとしても、当該生成行為が、故意又は過失によって第三者の営業上の利益や、人格的利益等を侵害するものである場合は、その他の要件を満たす限りにおいて、当該行為者が不法行為責任や人格権侵害に伴う責任を負う場合はあり得ると考えられる(後掲(3)ウも参照)。

文化庁「「AIと著作権に関する考え方について(素案)」

著作権法上問題の無いアイデアにとどまる生成物でもそれを使って営業妨害や嫌がらせをしだしたら民法上の不法行為に訴えることも考えられます。

故意又は過失によって他人の権利又は法律上保護される利益を侵害した者は、これによって生じた損害を賠償する責任を負う。

民法709条


(ウ)情報解析に活用できる形で整理したデータベースの著作物の例について

○ 本ただし書に該当すると考えられる例としては、「基本的な考え方」(9頁)において、「大量の情報を容易に情報解析に活用できる形で整理したデータベースの著作物が販売されている場合に,当該データベースを情報解析目的で複製等する行為」が既に示されている。
○ この点に関して、上記の例で示されている「大量の情報を容易に情報解析に活用できる形で整理したデータベースの著作物」としては、DVD 等の記録媒体に記録して提供されるもののみならず、インターネット上でファイルのダウンロードを可能とすることや、データの取得を可能とする API(ApplicationProgramming Interface)の提供などにより、オンラインでデータが提供されるものも含まれ得ると考えられる。

文化庁「「AIと著作権に関する考え方について(素案)」

具体的な判断は最終的に司法の場でなされるものであるが,例えば,大量の情報を容易に情報解析に活用できる形で整理したデータベースの著作物が販売されている場合に,当該データベースを情報解析目的で複製等する行為は,当該データベースの販売に関する市場と衝突するものとして「著作権者の利益を不当に害することとなる場合」に該当するものと考えられる。

令和元年10月24日,文化庁著作権課,デジタル化・ネットワーク化の進展に対応した柔軟な権利制限規定に関する基本的な考え方(著作権法第30条の4,第47条の4及び第47条の5関係)


ここでは但し書きの例に出てくるデータベースの著作物の複製等について詳しく解釈を掘り下げています。

  • 大量の情報を容易に情報解析に活用できる形で整理したデータベースの著作物

  • 販売されている場合に

  • 当該データベースを情報解析目的で複製等する行為

この但し書きの解釈は3つに分けられます

1つ目は①大量の情報を容易に情報解析に活用できる形で整理したデータベースの著作物ですが必ずしも情報解析を目的のデータベース作成を行う必要は無いみたいです。

ここでデータベースまたはデータベースの著作物の定義について確認していきます。

十の三 データベース 論文、数値、図形その他の情報の集合物であつて、それらの情報を電子計算機を用いて検索することができるように体系的に構成したものをいう。

著作権法第二条 定義


データベースでその情報の選択又は体系的な構成によつて創作性を有するものは、著作物として保護する。
2 前項の規定は、同項のデータベースの部分を構成する著作物の著作者の権利に影響を及ぼさない。

第十二条の二 データベースの著作物


 著作権法上の「データベース」は情報の集合物として定義されていて、素材には特定の制限がありません。論文、数値、図形など、著作物であれ非著作物であれ、人間にとって意味のある内容を持つ情報が含まれます。後半部分で述べられているように、データベースに含まれる情報は検索可能でなければならず、それ自体に独立性と意味を持つ必要があります。また、情報を検索するためのコンピュータープログラムは、データの集合体とは異なり、独立した創作物として扱われます。

さらに「電子計算機を用いて検索することができるように体系的に構成したもの」と呼べる必要があり、例え情報の集まりであっても、電子計算機を用いた検索が不可能なものはデータベースとはみなされません。そのため、データベースとして扱われるためには、通常、デジタル化されている必要があるとされていますが、一部の見解では、必ずしも機械可読形式である必要はないとされています。しかし、機械が読み取れないものは、編集物として扱うのが適当であり、データベースには該当しないと理解されます。法律上、「編集物」の定義はないが、データベースは編集物には含まれないと規定されているため、非電子的なものは編集物とされます。

さらに、データベースと認められるためには、検索可能な状態で体系的に構成されていることが求められます。「体系的構成」とは、収集した情報を整理し、項目や構造形式を定めたフォーマットを作成することを指す。これは物理的な配置や、編集物における「配列」とは異なる概念である。現代では、デジタル化された情報は、整理や体系化されていなくても検索可能なことが多いが、キーワードの付与、情報のグルーピング、フィールドの指定などの整理・体系化の存在により、データベースとみなされることになる。」という表現になります。

また体系的構成に創作性があるというためには,収集,選定した情報を整理統合するために,情報の項目,構造,形式等を決定して様式を作成し,分類の体系を決定するなどのデータベースの体系の設定が行われることが必要であると解される。

(東京地判平成26年3月14日平21 (ワ)16019号〔旅行業者用データベース事件第1審〕)


著作権法第二条 十の三 データベース

次に「データベースの著作物」とは

データベースであり、情報の選択または体系的構成に創作性があり著作物として保護されるものです

データベースの著作物の例として

データベースが取り扱う「情報」は著作物でも非著作物でも該当します。ただし法2条の定義的から、個別の情報を検索可能にするための独立性が必要とされています。本条からデータベースが著作物として著作権保護されるためには情報の選択または体系的構成に創作性が必要です。

本件データベースは, Xが, 日本国内に実在する国産又は国内の自動車メーカーの海外子会社によって日本国内販売向けに海外で製造された四輪自動車であると判 断した自動車のデータ並びにダミーデータ及び代表デー タを収録したものであると認められるが, 以上のような実在の自動車を選択した点については, 国内の自動車整備業者向けに製造販売される自動車のデータベースにお いて,通常されるべき選択であって,本件データベース に特有のものとは認められないから、 情報の選択に創作性があるとは認められない。

(東京地中間判平成13年5月25日判時1774号132頁〔自動車データベース(翼システム)事件〕)


そうすると,原告が費用や労力をかけて作り上げた原告CDDBに関して主張する保護されるべき利益とは,結局,原告が著作権法によって保護されるべきと主張する法的利益,すなわち,原告CDDBの情報の選択方針や,情報内容それ自体といったアイデアや抽象的な特徴,ないし表現それ自体でないものに基づく利益と異なるものではないことになり,それらの点が著作権法によっては保護されないものであることは前記判示のとおりである。
データベースにおける創作性は,情報の選択又は体系的構成に,何らかの形で人間の創作活動の成果が表れ,制作者の個性が表れていることをもって足りるものと解される。

(東京地判平成26年3月14日 平21(ワ) 16019号 〔旅行業者用データベース事件第1審])


タウンページデータベースの職業分類体系は、検索の利便性の観点から、個々の職業を分類し、これらを階層的に積み重ねることによって、全職業を網羅するように構成されたものであり、原告独自の工夫が施されたものであって、これに類するものが存するとは認められないから、そのような職業分類体系によって電話番号情報を職業別に分類したタウンページデータベースは、全体として、体系的な構成によって創作性を有するデータベースの著作物であるということができる。

(東京地判平成12年3月17日判時1714号128頁 (NTTタウ ンページ事件])


当該データベースが取引されると考えられる業界の状況や先行データベースとの関係等の制約から,当該業界で情報として必須とされる項目は限られてくると考えられるから,業界で通常必須とされる情報項目を設定したにすぎないような,多くの項目を含まないデータベースであれば,単に「アクセス」というコンピュータソフトを使用してその業界一般の情報項目を設定して情報を分類する体系を作成したにすぎないとして,著作物性を否定される場合もあり得よう。

(東京地中間判平成14年2月21日平12 (7)9426号 〔新築分譲マンションデータベース 事件〕)


データベースに人間の創作性を有することに肯定的な判決も多く。他の著作物と比較しても著作物性に高い基準を持っているかどうかは考慮する余地があります。また、著作権法では創作的表現の保護を原則としていますので、データベースの著作物においては情報の選択や体系的構成が創作性の部分にあたり、情報の収集やデジタル化などを保護することを設定するのは困難になります。


 データベースの著作物の創作性については

データベースが著作権保護を受けるための創作性は情報の選択または体系的な構成のどちらかが認められれば十分です。

データベースの場合、情報の選択よりも体系的構成が創作性の基準になる事例が多いです。これは情報収集においてその選択は誰でも同じ結果になる場合が多いため情報の選択の方が創作性を認められることが困難だからです。

タウンページデータベースの職業分類は、右(一)記載の一〇〇の職業分類を含む職業分類を小分類として、複数の小分類を包摂する中分類、さらに複数の中分類を包摂する大分類の三層構造となっている
タウンページデータベースの複数の職業分類をまとめて一つの職業分類とし、右の複数の職業分類に掲載されている電話番号情報を掲載して、複数の職業分類を包摂する職業分類名を付した部分は、タウンページデータベースの創作性を有する体系的な構成をもとにしており、複数の職業分類をまとめた点を除いては、独自に分類したというようなものではないから、この部分についても、タウンページデータベースの創作性を有する体系的な構成が再現されているということができる。

(東京地判平成12年3月17日判時1714号128頁 (NTTタウ ンページ事件])


原告データベースは,別紙図1のとおりの構造を含むと認められるところ,そのテーブルの項目の内容(種類及び数),各テーブル間の関連付けのあり方について敷衍して述べると,PROJECTテーブル,詳細テーブル等の7個のエントリーテーブルと法規制コードテーブル等の12個のマスターテーブルを有し,エントリーテーブル内には合計311のフィールド項目を,マスターテーブル内には78のフィールド項目を配し,各フィールド項目は,新築分譲マンションに関して業者が必要とすると思われる情報を多項目にわたって詳細に採り上げ,期分けID等によって各テーブルを有機的に関連付けて,効率的に必要とする情報を検索することができるようにしているものということができる。すなわち,客観的にみて,原告データベースは,新築分譲マンション開発業者等が必要とする情報をコンピュータによって効率的に検索できるようにするために作成された,上記認定のとおりの膨大な規模の情報分類体系というべきであって,このような規模の情報分類体系を,情報の選択及び体系的構成としてありふれているということは到底できない。

(東京地中間判平成14年2月21日平12 (7)9426号 〔新築分譲マンションデータベース 事件〕)

ただし、体系的構成は認識が困難であることから、「アイデア」と「表現」を区別することについて判断が分かれることになります。また、データベースが情報の集合物であることだけではなく、体系的な構成による保護が認められることが重要であるとして、類似性の判断に情報が異なることを基準に入れることを疑問視する学説も存在します。

また、データベースの定義から、情報とは編集体系下の集合物であつて、個別に検索可能にすることが前提とされています。そのため、データベースを構成する要素自体は情報の定義に該当すると判断するのは困難です。

「eBASEserver」は,食品の商品情報を広く事業者間で連携して共有する方法を実現するためのデータベースを構築するためのデータベースパッケージソフトウェアであって,食品の商品情報が蓄積されることによりデータベースが生成されることを予定しているものである。そうすると,このような食品の商品情報が蓄積される前のデータベースパッケージソフトウェアである「eBASEserver」は,「論文,数値,図形その他の情報の集合物」(著作権法2条1項10号の3)とは認められない」

(東京地判平成30年3月28日 平27(7) 21897号平28(7)37577号 〔eBASEserver 事件〕)


データベースの著作物の保護範囲として

データベースの著作物と認められれば、そのデータベースの全体の利用に対して侵害における類似性が肯定されると解釈することは問題ではありませんが、他方、データベースの一部の情報のみが利用された場合に侵害が成立するかが問題になってきます。この場合データベースの著作物の創作性の部分に注目し著作物を用いることがどのような場合かを明確化する必要があります。

データベースの著作物に修正または増減が行われた場合に、データベースに蓄積された情報を利用されている場合でも、情報の選択や体系的構成などのデータベースの創作性が異なっている場合が存在します。

そのため、目に見えて両者に共通する部分のみならず、両データベースを比較することによって情報の選択方針や体系的構成などの共通点を検討する必要があります。

客観的にみて,原告データベース被複製部分のみをとっても,新築分譲マンション開発業者等が必要とする情報をコンピュータによって効率的に検索できるようにするために作成された,膨大な規模の情報分類体系といわなければならず,このような規模の情報分類体系を,情報の選択及び体系的構成としてありふれているということは,到底できない。

(東京地中間判平成14年2月21日平12 (7)9426号 〔新築分譲マンションデータベース 事件〕)


著作権法 第十二条の二 データベースの著作物

○ また、「当該データベースを(……)複製等する行為」に関しては、データベースの著作権は、データベースの全体ではなくその一部分のみが利用される場合であっても、当該一部分でも創作的表現部分が利用されれば、その部分についても及ぶ(加戸守行『著作権法逐条講義 七訂新版』(公益社団法人著作権情報センター、2021 年)142 頁参照)とされている。

文化庁「「AIと著作権に関する考え方について(素案)」

データベースの著作物に関する今まで説明した内容を考慮に入れてこの解説を見てみます。

データベースの創作的表現の部分は情報の選択または体系的構成です。データベース作成の際その情報収集つまり情報の選択は誰がやっても同じありふれたものになるため創作性が出にくいです。それなのでデータベースの著作物の創作性はもっぱら体系的構成の部分が評価されます。

 データベースの一部の情報のみが利用された場合には両データベースを比較して情報の選択や体系的構成など創作的表現部分の共通点を検討する必要があります。

○ これを踏まえると、例えば、インターネット上のウェブサイトで、ユーザーの閲覧に供するため記事等が提供されているのに加え、データベースの著作物から容易に情報解析に活用できる形で整理されたデータを取得できる API が有償で提供されている場合において、当該 API を有償で利用することなく、当該ウェブサイトに閲覧用に掲載された記事等のデータから、当該データベースの著作物の創作的表現が認められる一定の情報のまとまりを情報解析目的で複製する行為は、本ただし書に該当し、同条による権利制限の対象とはならない場合があり得ると考えられる 20。
20 API により提供されているのが「大量の情報を容易に情報解析に活用できる形で整理したデータベースの著作物」に該当するか否か、及び、本ただし書法第 30 条の4ただし書に該当するか否かについては個別の事例に応じた検討が必要となるが、具体例としては、学術論文の出版社が論文データについてテキスト・データマイニング用ライセンス及び API を提供している事例や、新聞社が記事データについて同様のライセンス及び API を提供している事例等がある。もっとも、テキスト・データマイニング用ライセンス及び API を提供しているとしても、当該 API が「大量の情報を容易に情報解析に活用できる形で整理したデータベースの著作物」に当たるとは限らないといった意見もあった。

文化庁「「AIと著作権に関する考え方について(素案)」


但し書きの解釈を現実に当てはめてさらに具体的にした例を挙げています。

データベースの著作物から容易に情報解析に活用できる形で整理されたデータを取得できる API が有償で提供されている場合において

当該 API を有償で利用することなく、当該ウェブサイトに閲覧用に掲載された記事等のデータから、当該データベースの著作物の創作的表現が認められる一定の情報のまとまりを情報解析目的で複製する行為

これらのAPIが「大量の情報を容易に情報解析に活用できる形で整理したデータベースの著作物」に該当するかどうか検討する必要があるみたいです

これに該当する具体的な例として

・学術論文の出版社が論文データについてテキスト・データマイニング用ライセンス及び API を提供している事例

・新聞社が記事データについて同様のライセンス及び API を提供している事例

の2つを上げていますが「大量の情報を容易に情報解析に活用できる形で整理したデータベースの著作物」に当たるとは限らないようです。どっちだよ。

 そもそもこの2つは情報解析に適した形で整理したデータベースと呼べるのでしょうか。仮にそのようなデータベースを作成していたとしても果たして著作物性があるのでしょうか。

但し書きに該当するのは論文データや記事データのような言語の著作物等を指しているのではなく、その情報を選択し、検索可能な形に体系的な構成にまとめたデータベースの著作物の複製等です。

 果たしてただ論文や新聞のデータを網羅的にまとめたデータベースに情報の選択や体系的な構成などといったデータベースの著作物の創作性の部分(情報の選択、体系的構成)が評価されるかおおいに疑問です。


(エ)本ただし書に該当し得る上記(ウ)の具体例について(学習のための複製等を防止する技術的な措置が施されている場合等の考え方)

○ 著作権法上の権利制限規定は、文化的所産の公正な利用に配慮して、著作権者の許諾なく著作物を利用できることとするものである。また、こうした権利制限規定のうち、法第30条の4は、「著作物に表現された思想又は感情の享受を目的としない行為については、著作物の表現の価値を享受して自己の知的又は精神的欲求を満たすという効用を得ようとする者からの対価回収の機会を損なうものではなく、著作権法が保護しようとしている著作権者の利益を通常害するものではないと考えられるため、当該行為については原則として権利制限の対象とすることが正当化できるものと考えられる」(「基本的な考え方」6頁)との観点から立法されたものである。
○ このような権利制限規定一般についての立法趣旨、及び法第 30 条の4の立法趣旨からすると、著作権者が反対の意思を示していることそれ自体をもって、権利制限規定の対象から除外されると解釈することは困難である。そのため、こうした意思表示があることのみをもって、法第 30 条の4ただし書に該当するとは考えられない。

文化庁「「AIと著作権に関する考え方について(素案)」


 権利制限は著作権者の権利を制限するものであり、ごく一部の例外(法32条の二項、法39条、47条の5など)を除けば著作権者の反対の意思表示だけで権利制限の対象から除外される解釈されるのは困難です。そのため意思表示だけで法30条の4の但し書きに該当するとは考えられません。それもAI学習のための情報収集はスクレイピングによって集めるのが前提です。その意思表示はクローラが読み取ってくれるでしょうか?

○ 他方で、AI 学習のための著作物の複製等を防止するための、機械可読な方法による技術的な措置としては、現時点において既に広く行われているものが見受けられる。こうした措置をとることについては、著作権法上、特段の制限は設けられておらず、権利者やウェブサイトの管理者の判断によって自由に行うことが可能である。
(例)ウェブサイト内のファイル”robots.txt”への記述によって、AI 学習のための複製を行うクローラによるウェブサイト内へのアクセスを制限する措置 (例)ID・パスワード等を用いた認証によって、AI 学習のための複製を行うクローラによるウェブサイト内へのアクセスを制限する措置 ○ このような技術的な措置は、あるウェブサイト内に掲載されている多数のデータを集積して、情報解析に活用できる形で整理したデータベースの著作物として販売する際に、当該データベースの販売市場との競合を生じさせないために講じられていると評価し得る例がある(データベースの販売に伴う措置、又は販売の準備行為としての措置)21。

21 このような、AI 学習のための著作物の複製等を防止する技術的な措置と、情報解析に活用できる形で整理したデータベースの著作物としての販売が併せて実施されている具体例としては、The New YorkTimes(米国)が自社記事を掲載するウェブサイトの robots.txt において AI 学習データ収集用クローラをブロックし、別途、テキスト・データマイニング用ライセンス及び API を提供している事例や、Financial Times、The Guardian(いずれも英国)が同様の取組を行っている事例、Axel Springerドイツ)が傘下メディアの記事を掲載するウェブサイトの robots.txt において AI 学習データ収集用クローラをブロックし、別途、OpenAI(米国)に対して AI 学習及び AI による要約等の生成に関する記事データのライセンスを提供している事例等がある。

○ そのため、AI 学習のための著作物の複製等を防止する技術的な措置が講じられており、かつ、このような措置が講じられていること等の事実から、当該ウェブサイト内のデータを含み、情報解析に活用できる形で整理したデータベースの著作物が将来販売される予定があることが推認される場合には 22、この措置を回避して当該ウェブサイトから AI 学習のための複製等をする行為は、当該データベースの著作物の将来における潜在的販路を阻害する行為として、本ただし書に該当し、法第 30 条の4による権利制限の対象とはならないことが考えられる 23。

22 この点に関して、例えば、robots.txt において、あらゆる AI 学習用クローラをブロックする措置までは取られていないものの、ある AI 学習用クローラについてはこれをブロックする措置が取られているといった場合、この事情は、当該ウェブサイト内のデータを含み、情報解析に活用できる形で整理したデータベースの著作物が将来販売される予定があることを推認させる一要素となると考えられる。

23 この点に関しては、この措置を回避して行う AI 学習のための複製等であっても、当該データベースの著作物の将来における潜在的販路を阻害する行為に当たるとは限らない、といった意見もあった。

文化庁「「AIと著作権に関する考え方について(素案)」

 

 機械可読可能な形での技術的な措置でデータベースの販売に伴う措置や又は販売の準備行為としての措置として推認するのはかなり無理があると思います。

例えば、法47条の5(電子計算機による情報処理及びその結果の提供に付随する軽微利用等)には(当該行為の一部を行う者を含み、当該行為を政令で定める基準に従つて行う者に限る。)というかっこ書きがあります。

この「政令で定める基準」とは

具体的には,令第7条の4第1項第1号では,ID・パスワード等により受信を制限するための手段が講じられた情報は,当該手段を講じた者の承諾を得たものに限って利用すること(同号イ),検索結果の提供を適正に行うために必要な措置として「文部科学省令で定める措置」を講ずること(同号ロ)としている。この「文部科学省令で定める措置」として,規則第4条の4では,robots.txtファイルやHTML等に特定の事項が一般の慣行に従って記載されている場合には,そうした記載の対象となる情報を検索結果に表示しないことを規定している。

令和元年10月24日,文化庁著作権課, デジタル化・ネットワーク化の進展に対応した柔軟な権利制限規定に関する基本的な考え方(著作権法第30条の4,第47条の4及び第47条の5関係)

もし法30条の4も同じく「robots.txt」などで防ぐようにしたいのなら、法47条の5のようにその旨を明記すべきです。それなのに但し書きの解釈に一任することは果たして正しいでしょうか?

ここでEUの機械学習に関するDSM(デジタル単一市場における著作権指令)を見ていきます。

第3条 学術研究目的でのテキストおよびデータマイニング
1.加盟国は、研究組織および文化遺産機関が、学術研究のために、適法にアクセスする著作物または他の保護対象物のテキストおよびデータマイニングの目的で行う複製または抽出のために、指令96/9/EC第5条(a)および第7条第1項、指令2001/29/EC第2条ならびに本指令第15条第1項に定める権利に対する例外または制限を規定しなければならない。

第4条 テキストおよびデータマイニングのための例外または制限
1.加盟国は、テキストおよびデータマイニングの目的で、適法にアクセスできる著作物および他の保護対象物の複製および抽出のために、指令96/9/EC第5条(a)および第7条第1項、指令2001/29/EC第2条、指令2009/24/EC第4条第1項(a)、(b)ならびに本指令第15条第1項に定める権利に対する例外を規定しなければならない。

3.第1項に定める例外または制限は、権利者が、オンラインで公衆に利用可能とされるコンテンツのため機械により読み取り可能となる手段のような適切な方法で、同項にいう著作物や他の保護対象物の使用を明示的に留保していないことを条件として、適用されなければならない。

デジタル単一市場における著作権指令

EUは機械学習などデータマイニングを行う際、オプトアウト(正確には機械判読可能な状態で権利留保)しなければいけませんが、学術研究目的ではそのような項目は無く使い放題です。

 日本が「robots.txt」などでこれを防げるようになったら、AI開発において学術研究目的なら著作物を使い放題EUよりも厳しい国家になる可能性もあります。

「情報解析に活用できる形で整理したデータベースの著作物が将来販売される予定があることが推認される場合」は新聞などの報道機関は考慮に入れません。

新聞社が記事データを「robots.txt」で防げると思って、それにAI開発企業が従ってしまったら日本のAI開発(特に大規模言語モデル)は大きく遅れることになります。

○ なお、このような技術的な措置が、著作権法に規定する「技術的保護手段」又は「技術的利用制限手段」に該当するか否かは、現時点において行われている技術的な措置が、従来、「技術的保護手段」又は「技術的利用制限手段」に該当すると考えられてきたものとは異なることから、今後の技術の動向も踏まえ検討すべきものと考えられる。

文化庁「「AIと著作権に関する考え方について(素案)」


 技術的保護手段はコピーコントロールもしくは一部アクセスコントロールを含みますが、「robots.txt」は複製等の著作物利用を防いでいるわけではないので技術的保護手段には含まれないと思います。もし含むなら法47条の5で「robots.txt」を「政令で定める基準」なんて回りくどい言い方をせず、法30条私的複製のように技術的保護手段と明記すればいいだけだと思います。


(エ)海賊版等の権利侵害複製物を AI 学習のため複製することについて

○インターネット上のデータが海賊版等の権利侵害複製物であるか否かは、究極的には当該複製物に係る著作物の著作権者でなければ判断は難しく、AI 学習のため学習データの収集を行おうとする者にこの点の判断を求めることは、現実的に難しい場合が多いと考えられる。加えて、権利侵害複製物という場合には、漫画等を原作のまま許諾なく多数アップロードした海賊版サイトに掲載されているようなものから、SNS 等において個人のユーザーが投稿する際に、引用等の権利制限規定の要件を満たさなかったもの等まで様々なものが含まれる。
○ このため、AI 学習のため、インターネット上において学習データを収集する場合、収集対象のデータに、海賊版等の、著作権を侵害してアップロードされた複製物が含まれている場合もあり得る。

文化庁「「AIと著作権に関する考え方について(素案)」


AI学習に海賊版を利用することについて2つの条文を見てもらいたいです。

著作権の目的となつている著作物(以下この款において単に「著作物」という。)は、個人的に又は家庭内その他これに準ずる限られた範囲内において使用すること(以下「私的使用」という。)を目的とするときは、次に掲げる場合を除き、その使用する者が複製することができる。

四 著作権(第二十八条に規定する権利(翻訳以外の方法により創作された二次的著作物に係るものに限る。)を除く。以下この号において同じ。)を侵害する自動公衆送信(国外で行われる自動公衆送信であつて、国内で行われたとしたならば著作権の侵害となるべきものを含む。)を受信して行うデジタル方式の複製(録音及び録画を除く。以下この号において同じ。)(当該著作権に係る著作物のうち当該複製がされる部分の占める割合、当該部分が自動公衆送信される際の表示の精度その他の要素に照らし軽微なものを除く。以下この号及び次項において「特定侵害複製」という。)を、特定侵害複製であることを知りながら行う場合(当該著作物の種類及び用途並びに当該特定侵害複製の態様に照らし著作権者の利益を不当に害しないと認められる特別な事情がある場合を除く。)

第30条 私的使用のための複製


電子計算機を用いた情報処理により新たな知見又は情報を創出することによつて著作物の利用の促進に資する次の各号に掲げる行為を行う者(当該行為の一部を行う者を含み、当該行為を政令で定める基準に従つて行う者に限る。)は、公衆への提供等(公衆への提供又は提示をいい、送信可能化を含む。以下同じ。)が行われた著作物(以下この条及び次条第二項第二号において「公衆提供等著作物」という。)(公表された著作物又は送信可能化された著作物に限る。)について、当該各号に掲げる行為の目的上必要と認められる限度において、当該行為に付随して、いずれの方法によるかを問わず、利用(当該公衆提供等著作物のうちその利用に供される部分の占める割合、その利用に供される部分の量、その利用に供される際の表示の精度その他の要素に照らし軽微なものに限る。以下この条において「軽微利用」という。)を行うことができる。ただし、当該公衆提供等著作物に係る公衆への提供等が著作権を侵害するものであること(国外で行われた公衆への提供等にあつては、国内で行われたとしたならば著作権の侵害となるべきものであること)を知りながら当該軽微利用を行う場合その他当該公衆提供等著作物の種類及び用途並びに当該軽微利用の態様に照らし著作権者の利益を不当に害することとなる場合は、この限りでない。

第47条の5 電子計算機による情報処理及びその結果の提供に付随する軽微利用等


法30条では二項、法47条の5では但し書きに違法アップロードした著作物のデータを知っていながら利用することを権利制限対象外としています。

 しかし、法30条の4にはこのような記述は見られません。

 このように他の権利制限との兼ね合いから海賊版をAI学習に利用することについて、それを曖昧な但し書きの解釈に一任して除外することは無理があります。

 条文上だけではなく現実的にもネット上の著作物データが果たして適法なのか違法なのかを判読することは困難で現実的ではなく、大量のデータをスクレイピングで集めることが前提の生成AI開発ではこれが足かせになってしまう可能性が高くなります。

○ 他方で、海賊版により我が国のコンテンツ産業が受ける被害は甚大であり、リーチサイト規制を含めた海賊版対策を進めるべきことは論を待たない。文化庁においては、権利者及び関係機関による海賊版に対する権利行使の促進に向けた環境整備等、引き続き実効的かつ強力に海賊版対策に取り組むことが期待される。

○ AI 開発事業者や AI サービス提供事業者においては、学習データの収集を行うに際して、海賊版を掲載しているウェブサイトから学習データを収集することで当該ウェブサイトの運営を行う者に広告収入その他の金銭的利益を生じさせるなど、当該行為が新たな海賊版の増加といった権利侵害を助長するものとならないよう十分配慮した上でこれを行うことが求められる。

○ 特に、ウェブサイトが海賊版等の権利侵害複製物を掲載していることを知りながら、当該ウェブサイトから学習データの収集を行うといった行為は、厳にこれを慎むべきものである。この点に関して、生成・利用段階においては、後掲(2)キのとおり、既存の著作物の著作権侵害が生じた場合、AI 開発事業者又はAI サービス提供事業者も、当該侵害行為の規範的な主体として責任を負う場合があり得る。この規範的な行為主体の認定に当たっては、当該行為に関する諸般の事情が総合的に考慮されるものと考えられる。

○ AI 開発事業者や AI サービス提供事業者が、ウェブサイトが海賊版等の権利侵害複製物を掲載していることを知りながら、当該ウェブサイトから学習データの収集を行ったという事実は、これにより開発された生成 AI により生じる著作権侵害についての規範的な行為主体の認定に当たり、その総合的な考慮の一要素として、当該事業者が規範的な行為主体として侵害の責任を問われる可能性を高めるものと考えられる(AI 開発事業者又は AIサービス提供事業者の行為主体性について、後掲(2)キも参照)24。

○ この点に関して、こうした海賊版等の権利侵害複製物を掲載するウェブサイトからの学習データの収集は、少量の学習データを用いて、学習データに含まれる著作物の創作的表現の影響を強く受けた生成物が出力されるような追加的な学習を行うことを目的として行われる場合もあると考えられる。このような追加的な学習を行うことを目的として、学習データの収集のため既存の著作物の複製等を行う場合、開発・学習段階においては上記イ(イ)のとおり、具体的事案に応じて、学習データの著作物の創作的表現(表現上の本質的特徴)を直接感得できる生成物を出力することが目的であると評価される場合は、享受目的が併存すると考えられるが 25、これに加えて、生成・利用段階においては、これにより追加的な学習を経た生成 AI が、当該既存の著作物の創作的表現を含む生成物を生成することによる、著作権侵害の結果発生の蓋然性が認められる場合があると考えられる。

○ そのため、海賊版等の権利侵害複製物を掲載するウェブサイトからの学習データの収集を行う場合等に、事業者において、このような、学習データに含まれる著作物の創作的表現の影響を強く受けた生成物が出力されるような追加的な学習を行う目的を有していたと評価され、当該生成 AI による著作権侵害の結果発生の蓋然性を認識しながら、かつ、当該結果を回避する措置を講じることが可能であるにもかかわらずこれを講じなかったといえる場合は、当該事業者は著作権侵害の結果発生を回避すべき注意義務を怠ったものとして、当該生成 AI により生じる著作権侵害について規範的な行為主体として侵害の責任を問われる可能性が高まるものと考えられる。

24 この点に関して、ある複製物が海賊版等の権利侵害複製物である旨の通知を権利者から受ける等して、AI 学習のための複製を行う AI 開発事業者や AI サービス提供事業者が、当該複製物が海賊版等の権利侵害複製物である旨の認識を有するに至った場合、当該複製物を AI 学習に用いた生成 AI の開発・提供において、当該事業者が当該複製物に係る著作物の創作的表現が出力されることを防止する技術的な措置を何らとらない場合は、これにより開発された生成 AI により生じる著作権侵害についての規範的な行為主体の認定に当たり、当該事業者が規範的な行為主体として侵害の責任を問われる可能性が高まる、といった意見があった。また、このような認識を有しながら、又は通常有するべきであったにもかかわらず、海賊版等の権利侵害複製物である当該複製物を AI 学習に用いるため著作物の複製等を行った場合、本ただし書への該当可能性を高める要素となる、といった意見があった。

25 上記イ(イ)のとおり、他方で、学習データの著作物の創作的表現(表現上の本質的特徴)を直接感得できる生成物を出力することが目的であるとは評価されない場合は、享受目的が併存しないと考えられる。

文化庁「「AIと著作権に関する考え方について(素案)」


 海賊版を利用することは法的解釈上は問題ないですが、海賊版ウェブサイトからデータ収集をすることは海賊版サイトの広告収入を潤したり、開発自身が権利侵害の主体になるリスクがあるから慎むべきといったことがずらーっと書かれています

 妥当な解釈だと思います。侵害に対する措置はのちの項目で扱います。

→【侵害に対する措置について】に続く

参考資料

条解著作権法(小泉直樹他、弘文堂、2023年6月15日

著作権法(第4版),中山信弘,有斐閣,2014年10月25日,

文化庁「「AIと著作権に関する考え方について(素案)」

この記事が気に入ったらサポートをしてみませんか?