見出し画像

データサイエンスニュース(24/01/09) : "AIの進化と著作権の綱引き”

生成AIと著作権侵害の問題は、ある程度今年方針がでてくるのでしょうか。

記事によると、OpenAI側の主張は

  • NYタイムズと同じ内容が出てきたというけど、それは「そのように作成しろ」と指示をしたから

  • AIが学習することは、「著作権で保護されている作品を著作権者の権利を侵害せずに利用する特定の方法」であるフェアユースにあたる

  • Webクローラーからのブロック方法も示している(それをやっていない、NYタイムズ側が悪い)

ということのようですね。

1点目は、「内容が全く同じ」ことに対する反論としてはいいですが、まったく同じでなくとも同じ内容のものを出典も示さずに、大部分を真似ることは、人間がやっても著作権違反なので、これは反論としては厳しいかなと。
3点目は、この文言通りだとすると、「家には鍵をかけるという方法があるのに、掛けてなかったから泥棒されても仕方がない」という論理が通ってしまうので、認めづらい気がします。

2点目のフェアユースが、どういう風に捉えられるか次第ですが、「生成AIで学習している範囲を示せば、一定までの利用はフェアユースとして認められる」みたいなルールに落ち着くといいですね。

ただ、これだけを見て、OpenAIざまぁと思っている人がいたらそれは短絡的と言わざるを得ません。
最終的には、OpenAIは資金力でNYタイムズを黙らせることもできます。(実際にそうなるのではないでしょうか)

そうなると、この訴訟で影響を受けるのは、資金力がないAIづくりをしている企業。
つまり、米国のベンチャー企業や、日欧の企業たちではないでしょうか。(中国は政治問題が絡むのでいったん検討からは除外)
これによって、米国とそれ以外の国(特に、日本)との間で、AIの競争力がさらに差がつかないことを祈ります。


そんな日本の生成AIサービス事情です。

NTTやNEC、ソフトバンクなどの通信・ハイテクの大企業が生成AIのサービスを提供するようです。

さて、それは、ChatGPTに比べてどのような強みがあるのでしょうか。
「日本語に強い」とかいう寝言を言わずに、ぜひその企業独自のデータを使うなど、良い強みを示しつつ、世界と戦っていってほしいものです。

NTT「tsuzumi」の特徴

・軽量なLLM ・日本語と英語に対応(多国語にも対応していく) ~特に日本語が得意なLLM~ ・柔軟なチューニング ~基盤モデル+アダプタ~ ・マルチモーダル ~言語+視覚・聴覚・ユーザ状況理解~

う~ん・・・。


この記事が気に入ったらサポートをしてみませんか?