人工知能について考えてみたこと

この記事はこの記事は法務系Advent Calendar2016 のエントリーです。

アドベントカレンダー初参加です。よろしくお願いいたします。@sora20140226さんからバトンを受け継ぎました。

 今回は、人工知能といっても法務担当には、全く関係ないよという方も多数かと思いますので、全体的にどのようところが問題なのといったことをとりあげたいとおもいます。

 人工知能を取り上げたのは、はやっているということもありますが、単純に個人的に興味があるということにつきます。大学進学時も、心理学科も選択肢にあり、知能(心理)とか人工知能とかには昔から関心がありました。

 今後は、勉強の備忘録をかねて人工知能の記事をアップしたいと考えており、今回はその頭出しという感じです。

1.そもそも人工知能って?

 まず、人工知能をうたい文句としているサービス、あるいは技術というのは、本当に人工知能なのというところから疑った方がよさそうです。

 現在、話題になっているものの多くは、人工知能の技術の内、ディープラーニング(あと機械学習)という手法を利用しているものです。人工知能研究の挫折の歴史は長く、第一次ブームの1950年代後半から始まっており、第二次ブームの1980年代~1995年、今回が第三次ブームと整理されています。一次と二次、二次と三次の間は冬の時代と呼ばれるもので、あまり技術的な進展がなかった時代ということになります(このあたりは、松尾豊「人工知能は人間を超えるか」第2章以下が詳しいです)。

 ただ、技術的には、現在のディープラーニングという手法も一次、二次の時代の技術と無関係ではなく、また、かつての時代の技術も一応その当時「人口知能」とよばれていたので、「人工知能」という言葉に含まれる技術というのは非常に幅があります。ディープラーニングは、ニューラルネットワークという技術の発展系ですが、こちらは人間の脳のニューロンを模倣するという方向性ですが、もう一つは、言語処理系の場合で確率を基礎とする技術(東ロボ君はこちらの系統)の方向性があるようです。

 というわけで、法務担当としては、人工知能で○○ができます!というのをみたら、コンピュータを導入すれば○○ができます!というのと同じぐらい中身のない言葉だと思っておけば良さそうです。なにができないのか、中身を確認しましょう(コンピュータのソフトを買う場合と同じです)。

 最近も、映画「君の名は。」の新海誠風の画像を人工知能で生成するというEverfilterという写真加工アプリが、実は君の名は。の画像を無許諾使用していたという事例があったばかりです(おそらく人工知能と無関係)。

 とはいいつつ、本屋なんかでは、2045年にシンギュラリティが起こる、人工知能が人間の知能を超えるといった文句がおどっていたりします。個人的にいろいろ人工知能関係の本を読んでいる限り、本当にそうなるのかについては疑問に思っています(あと何回か冬の時代をくぐり抜けないといけない)。まあ、いずれできるとはおもいますが・・・。

2.人工知能をめぐる法的問題について

 現在、主として議論されているのは、人工知能の学習済みデータをどのように保護するのかという点です。

 人工知能が作成した(とされる)、絵、音楽といったコンテンツが著作権で保護されるのかというのも論点としてはあります。が、解釈論としては、現状の人工知能のレベルでは、著作権では保護されないということでほぼ落ち着いているのではないかと思います。

 立法論としては、人工知能に法人格を認めて法的主体として扱い、著作権を帰属させる等いろいろ考えられているようですが、著作権法自体が、投下資本を投入したものを保護する(額に汗の理論)という考え方を基本的には否定しているので、著作権法の考え方の延長上での保護というのは、立法論としてもあまり筋がよくない様に思います。

 今のところ、人工知能が作成したとされるコンテンツは、実際には人間によるパラメータの設定等が介在しますが、その程度の人間の関与で著作物性を認めると、広告への注文程度で広告主に著作権を認めることになる等、現状の著作権法の解釈との整合性がとれなくなると考えています。

 他方、人間と同じ程度に本当の意味で思考(創作)できるのであれば、著作権法で保護してもいいと思います。人間もタンパク質ベースの機械に過ぎないと考えれば、シリコンベースあっても保護してもいいと思いますが、現状はそのレベルにはありません。また、仮に人間と同程度の創作が可能になって大量にコンテンツが作成されたとして、果たしてそれを消費したいと思うのか、現在でもコンテンツは飽和してライブ・体験に消費が移行しているのに、法的保護を与えても、と考えてしまいます。

3.学習済みモデルの保護

(1)学習済みモデルの著作権による保護

 学習済みモデルとは、簡単にいうと、学習用のデータを与えて一定の特徴量(数字の「9」とか人の顔)を抽出できるように学習させた結果です。

 今のところ、ある程度は自動的に学習するようになってきているのですが(この点が最近の技術的な最大の進歩)、学習するデータを大量に用意・工夫したり、勉強のしすぎで使いものにならない(過学習といって汎用性がなくなる)ことを避けるために試行錯誤が必要で、かつ、大量のコンピュータリソースが必要なことから、学習済みモデルの作成者の投下資本を回収させる必要があるのではないか、知的財産権で保護できるのかが問題になっています。 

 学習済みモデルは、簡略化して言えば、人の顔を学習させた学習済みモデルに画像データを与えると、人の顔が写っていれば人と認識できるようにしたプログラムとデータの集合体です(このあたりをわかりやすく解説したものとして、奥邨弘司「著作権法≫THE NEXT GENERATION~著作権の世界の特異点は近いか?~」コピライト№666/vol.56 2頁以下があります。人工知能の著作権法の論点もほぼ解説されており、お勧めです)。学習済みモデルの中身ですが、その本体は、ニューラルネットワーク間のパラメータ(重み付け)の集合体(数千から数億)の集合体です。パラメータなので、データであり、著作物性はないということになるでしょう。

 ニューラルネットワークのイメージはこの記事がわかりやすいと思います。「畳み込みニューラルネットワークの仕組み」

 この記事の後半、ディープラーニングについて解説している部分の写真を見てもらうと分かるように、色々な特徴を抽出して、人の顔ということを識別するのに適した特徴を抽出しています。このデータの塊が学習済みモデルの中身だと思われます(なお、パラメータを画像化して表示しているだけで実態は行列式の塊のはずです)。

 この学習済みモデルはこのパラメータ単体では役に立たないので、プログラムと組み合わされて一体として学習済みモデルとなります。プログラム部分をあわせたパッケージとして考えると一応著作物といいうることはできそうです。

 ただ、あくまでもパッケージ化された場合の話なので、学習結果のパラメータ部分をリバースエンジニアリング等により抽出されてしまうと保護されないことになってしまうので、それほど保護は厚くないでしょう。また、プログラムの部分はそれほど複雑なものではないので、別のプログラムで置き換えるのも比較的容易だと考えられます。

(2)学習済みモデルの著作権以外による保護

 著作権以外で保護する方法としては、営業秘密、特許法による保護が考えられます。

 営業秘密は、情報の内容に依存しませんので、いわゆる秘密管理性等の3要件を満たせば、学習済みモデルといったものも保護できることについては、問題ありません。ただ、特定の事業者単独で取り扱う場合はいいのですが、人工知能が学習するデータの収集等、関与する事業者が多数生じること、また、データはオープンにと言う方向性からすると、実務的にどこまで営業秘密としての管理を行えるかというと難しい所がありそうです。

 著作権法による保護があるとしても、薄い保護(デッドコピーに近いものしか保護されない)しかないとすれば、知的財産的な保護の方向性は特許として保護することが有効だと考えられます。人工知能もプログラムの構成要素なので、ソフトウェア関連発明としての保護ということになるでしょう。

 ただ、ニューラルネットワークやディープラーニングといった技術は、多数の計算をさせているだけ(ただ、その量が半端でない)という側面が強いです。数学自体は特許の対象とならないこと、特に米国でのアリス最高裁判決(AliceCorporation対CLSBankInternational事件)以降の発明の成立性(101条)への厳格な判断の傾向からすると(人工知能研究の主戦場である米国での特許化は必須でしょう)、特許による保護もそれほど広いものにはならないかもしれません(日本の場合、ソフトウェア関連発明の成立性の要件は現状それほど厳しくはありません)。

 また、ソフトウェア関連発明の一種としてデータ構造として保護するという方法もありますが、データ構造について、少なくとも日本ではそれほど特許として成立したもの多くなかったと思います。学習済みモデルの基本的な所を特許として抑えることは難しく、その応用部分を特許として保護する方向が中心になるのかと考えています。

 ビジネスモデルとしては、オープンソースソフトウェア(OSS)の様に、学習済みモデル本体ではなく、周辺で儲けるという形でしょうか。ただ、OSSが著作権による保護をベースに逆手にとっているのに、著作権による保護が薄い所があるので、そのままの形は流用しにくいと思われます。(学習済みモデルのビジネス展開について検討している文献としては、江村克己「人工知能の活用と共有経済の進展から考察するこれからの知的財産」知財研フォーラムVol.107、30頁以下が参考になります。)

 ここに取り上げた以外にも多数の論点があります。機会があれば取り上げたいと思います。

4.法務関係者のための人工知能関連文献ガイド

 備忘録として参考にした本の中で比較的法務の方向けの本を紹介したいと思います。論文(講演録)としては、先に紹介した奥邨弘司先生のコピライトのものが、著作権中心ですが、まとまっています。

(1)人工知能の現状を一般的に広く知りたい人向け

・松尾豊「人工知能は人間を超えるか」2015年 KADOKAWA / 中経出版

 2015年刊行で、少し古いですが、わかりやすいですし、現在の人工知能とその限界がよく分かります。

・清水亮「よく分かる人工知能 最先端の人だけが知っているディープラーニングの秘密」2016年 KADOKAWA

 基本的に、研究者との対談なので読みやすいです。最近刊行されたので内容的には最新。著者のブログでも人工知能の話題が取り上げられています。

(2)もう少し、人工知能の技術的な中身が分かりたい人向け

・斎藤 康毅「ゼロから作るDeep Learning ―Pythonで学ぶディープラーニングの理論と実装」2016年オライリージャパン

 人工知能についての解説は、数式がいきなり出てくるものが多いので、法務パーソンにはなかなかハードルが高いですが、それでも技術的な内容が分かりたいという方におすすめなのが、この本です。

 当然ながら、数式は出てくるのですが、数式がどのような意味があるのかということを図解しながら説明してくれるので、比較的わかりやすいです。あくまでも「比較的」なので、関数と微分のおおざっぱなイメージは必要ですが。ここでの「関数」は、ある入力に対して答えがでるもので出力結果がグラフになる、「微分」は、傾きを計算するためのものという程度でたります(傾きは学習が進んでいるかどうかといったことを判断するために求めます)。実際の計算は、pythonという数学計算に強いプログラミング言語にまかせて計算させるというものなので、関数とか微分の計算をする必要はありません。

 逆に、関数とか微分の計算だけで(まあ、いろいろコツみたいなものがあるようなのですが)、ものの形を学習し、識別できるようになることに驚きを感じられます。

以上です。

次は@kyoshimine先生です。


この記事が気に入ったら、サポートをしてみませんか?気軽にクリエイターを支援できます。

コメントを投稿するには、 ログイン または 会員登録 をする必要があります。