人工知能学会における研究の実態が不明な論文について

1.はじめに
本年五月二十三日から二十六日に開催されたJSAI2017(第31回人工知能学会全国大会)に於いて,二十四日に催されたオーガナイズドセッション「マイニングと知識創発(1)」の発表に際し公開された論文「ドメインにより意味が変化する単語に着目した猥褻な表現のフィルタリング」について,ソーシャルネットワーキングサービス(以後SNSと称す)で行われた批判に寄せて,問題点と思われるものについての私見をまとめる.

2.考えられうる問題点
前述の論文「ドメインにより意味が変化する単語に着目した猥褻な表現のフィルタリング」(以後当該論文と称す)に於いて,論文として問題があると思われる点について,以下の三点をあげる.
・序章に於ける私見と定義の混同
・本題に於ける人工知能と関係のない研究手法
・本題に於ける標本の取り扱い
後の章では上記三点について解説する.

3.「序章に於ける私見と定義の混同」
当該論文に於いて,序章に於いて以下のテキストがあった.
“インターネット上には未成年に対して有害な情報が溢れている.有害な情報とは法に触れてしまうものや,差別に関するもの,アダルト系,暴力表現,ギャンブルに関するもの,出会い系,グロテスクな表現と様々なものがある.有害な情報は,特にインターネット上の電子掲示板や2ちゃんねるやイラストコミュニケーションサービスのpixivがある.これらのサイトには有害な情報が掲載されることも少なくはない”
−−「ドメインにより意味が変化する単語に着目した猥褻な表現のフィルタリング」p.1,左段l.2より
第一に,「インターネット上には未成年に対して有害な情報が溢れている.」について,現代日本において表現に関する規制は主に抑制されており,一般に社会的損失を生じ得ると推定される「有害性のある情報」は,未成年者に限ったものとは言い難い.ヘルスケア情報を扱うキュレーションプラットフォーム「WELQ(ウェルク)」の不正確な内容に関する全記事非公開は約半年前の事件と記憶に新しい.これらは専門知識を持たない一般利用者に於いて健康被害を生じさせ得ると推定できる不正確なヘルスケア情報が問題視されたものである.
また,続けて有害な情報を「法に触れてしまうもの」「差別に関するもの」「アダルト系」「暴力表現」「ギャンブルに関するもの」「出会い系」「グロテスクな表現」と述べているが,前述の通りそれらに類せずとも一般に社会的損失を生じ得ると推定され,「有害性のある情報」と見なされ得るものは極めて多い.
当該論文において「有害な情報」とされているものについて,明確な定義に基づいて抽出されたものとは言い難く,執筆者の私見を断定的表現にて述べているものであると判断し得る.
第二に,「有害な情報は,特にインターネット上の電子掲示板や2ちゃんねるやイラストコミュニケーションサービスのpixivがある.」について,自明と言いがたい内容であり,またある程度自明性を持つとしても前述を断じるに於いて妥当性を示すための統計的根拠等の提示が一切ない.これらはいわゆるレッテル貼り,風評の類であり,研究論文の序章に於いて用いられるに適した表現とは言いがたい.

4.本題に於ける人工知能と関係のない研究手法
本題に於いて解説された研究手法について,発表場所として人工知能学会全国大会が選定されているにもかかわらず,人工知能研究に関連すると思われる手法が採用されていない.
当該論文の研究手法は「分類は全て人手で行い」(「ドメインにより意味が変化する単語に着目した猥褻な表現のフィルタリング」p.3,右段l.5より),「複数人にアンケートをとり,分類の見直しをする必要がある」(「ドメインにより意味が変化する単語に着目した猥褻な表現のフィルタリング」p.3,左段l.8より)と人力によるものを想定しており,既存の機械学習研究を参照していないと推定される部分がある.
既存の機械学習に於いては「標本を用いてAIに自動学習させた後,対照群サンプルに規定の判定をさせ,人力によってその精度を検討する」という手法が確立しており,現状多くの「人工知能による自動判定」がこの手法によって精度,実用性を検討されている.この手法の転用を基にしたフィルタリング方法の提案としては「特定の趣旨を示す文章を含む標本群で以って自動学習を行い,然るのち対照群を判定させ,その精度を検討すること」が考えられ,これにドメイン情報を併用することで一般に特定の趣旨を含まない文章に対する特定の趣旨の検出精度を上げることが考えられるが,当該論文に於いてはこうした人工知能の活用に関する提案は一切なかった.
当該論文の発表場所として人工知能学会全国大会が選択されたことは,その適当性について甚だ疑問である.

5.本題における標本の取り扱い
当該論文に於いて,標本として一般市民の創作物が使用されたが,ソーシャルネットワーキングサービス上に於いて「著作権者の許諾のない二次使用であった」旨が言及され,当該論文上に標本として使用された創作物の著作者が,全ての著作物の公開を取りやめる,ソーシャルネットワーキングサービス上で平常時登録ユーザーであれば閲覧可能であった公開レベルを特定条件下のユーザーのみが閲覧可能に変更する等の対応をとった旨が確認された(著作者の心情を慮り当人のアカウント名及び公開名については言及しない).
著作権法において,著作物の使用に関しては著作権者の権利が強く保護され,特に著作者人格権は「著作者が精神的に傷つけられないようにするための権利であり,創作者としての感情を守るためのものであることから,これを譲渡したり,相続したりすることはできないこととされています(第59条)」(出典:文化庁ホームページ 著作権なるほど質問箱/http://www.bunka.go.jp/chosakuken/naruhodo/outline/4.3.html).
前述の「創作物の公開を取りやめる」「ソーシャルネットワーキングサービス上の公開レベルをオープンでないものへの変更」は,未知の他者からの接触方法を減らす,著作物を人目から避けるといった行動と解釈でき,「前述の権利が侵害されたことへの防衛反応」という表現で示すことが可能であると考えられる.

6.まとめ
前述「2.考えられうる問題点」〜「5.本題における標本の取り扱い」に於いて示した通り,当該論文について,その手法,表現の妥当性については大いに疑問があり,十分に留意して検討されるべきであると結論づける.

この記事が気に入ったらサポートをしてみませんか?