雑感(クイズ問題の盗用と森羅万象データベースとか)

(推敲中)

・さて、最近BOOTH等でのクイズ問題集の電子出版が盛んになっている。
・Twitterを眺めていると、BOOTHやクイズ宅配便でクイズ問題集を販売開始した旨のツイートをよく見かけるようになった。

・2022年1月16日現在、BOOTHで「競技クイズ」のタグで検索すると、211点の商品がヒットする。
・ざっくりと一覧をまとめてみたが、数点の紙ベース問題集を除いてすべて電子書籍によるクイズ問題集であり、少なくとも200冊くらいはクイズの電子書籍があるようだ。
・こんなもんじゃないだろうと、試しに「クイズ」のタグで広く検索すると、1,355点もの商品が検索にひっかかった。こちらは、一覧をまだ精査できておらず、クイズ問題集以外も含まれるため多く出てきているが、2~3ページ眺めた感じから、少なくとも8割弱の1,000冊程はクイズの問題集が販売されていると見積もれそうだ。

・また、クイズ問題集の委託販売サイトであるクイズ宅配便(通称:Q宅)の「電子書籍・ダウンロード商品」のカテゴリには、654点もの商品が登録されており、BOOTHでも併せて販売しているものを考慮して差し引いても、合わせて1,300点位はありそうだ。(それにしても、DLマーケットの閉鎖が痛い。)

・新型コロナウイルス感染症への対応が求められ対面でのクイズ大会が減少している昨今、紙ではなく電子書籍によるクイズ問題集を発行するトレンドは、その手軽さも相まって、続いていくことだろう。


・途切れなく続く問題集ラッシュ。この上なく喜ばしい限りなのだが、どうも若干の不安がつきまとう。
・それは、「どれも同じようなクイズ問題なんじゃないのか?」ということだ。

・そりゃあクイズは作れば被る。森羅万象からの出題を謳うとはいえ、限られた制約の中で作られた傑作たちだ。行きつく先は皆同じ。世界の約束により、当然に収束する。

・しかし、それ以上の懸念というかソワソワ感を呼ぶのは、過去にクイズ界隈で幾度となく、クイズ問題の盗用(剽窃も含むか?)の問題、いわゆるパクリ騒動が起こってきたからだ。

・近い所だと、昨年(2021年)10月末に発生した、年間を通してクイズ会(要参加料)をオープンしていた〇〇〇氏(以降、氏と省略)主催のクイズスペースで発生した事案なんかが記憶に新しい。
(2022.1.14追記:書き上げようとしていた矢先、また、お菓子な事案が発生したようだ。ベタ問を集めていたようだが、引用先を出さないのは引用とはいわないだろう。)

・スマートフォン向けクイズアプリの「みんなで早押しクイズ(通称:みんはや)」では、自分で用意したクイズ問題を部屋に集まった参加者に出題できる「フリーマッチ機能」があり、自作問題を多くの人に解いてもらうにはもってこいの場所となっている。
・そのような中でも、各種クイズbotやフリーの問題集からコピペしたものを自作問題と称して出題する方もちょくちょくいるそうだ。フリーマッチ部屋で複垢プレイで正解を重ねる者といい、救われていないなぁ、クイズに寄りかかっているなぁ、と感じる。

・競技クイズ界隈でも、昔からたびたびトラブルを起こしている某氏は、QMAから抜き出した問題集を自作問題と称して販売したり、それを指摘されてからは、努力の結晶と名前を変えて頑張るなど、たびたび話題にあがってくる。
・一方で、競技クイズの強豪といわれるような者であっても、数々のクイズ大会で優勝した実績があるjso氏なんかは、他の問題集からスラッシュごとコピペして問題集を販売していたこともあったそうだ。お詫びとして無料のクイズ問題集を配布するという、なんだかよくわからない対応をしていたのも印象的だ。
・鳥居さんについては、何も言うまい。クイズにおいて剽窃(他人の著作から,部分的に文章,語句,筋,思想などを盗み,自作の中に自分のものとして用いること[コトバンクより])と自作との線引きはあいまいである。彼がクイズ界に貢献した成果は図りしれない。そして、それは現在進行中である。

・こういった、クイズ問題の盗用問題は、今までがそうであったように、これからも続くだろう。
・とはいえ、程度の差はあれ、他人が用意したクイズ問題を自作と銘打ち、金銭を受け取って有料頒布、販売するというのは、著作者名詐称罪のようで(著作物の要件を満たすかはあるが)、誠実さがなく、あまり気持ちの良い行為ではないだろう。

・この現状を生んでいる背景には、主に2つの問題があると思う。
・ひとつは、自作問題かパクリ問題かを判断するための手段を用意するのがムズイこと。パクリを指摘するにはパクリ元を特定しなければならない。これまで発覚したケースも、パクられた本人からの告発によりバレたものが大半であり、本人が見つけなければ放置されっぱなしである。
・もうひとつは、判断の手段がないことと密接に絡むのだが、そもそもクイズ問題におけるオリジナリティとは何か?という問いへの回答が煮詰まっておらず、共有されていないことに問題があると考える。クイズ問題の創作性とも言い換えられる。
・「創造」とはどういうことを指すか?ということに、考えが十分に及んでいないまま、感想を、そして、罵倒をぶつけ合っているのである。

・「その問題、パクリですね!」と指摘するためには、「どこで出された問題と同じであるか」を指摘し、そのうえで、「パクったと指摘されたけど、誰でも作れるような問題で、たまたま被っただけだよという主張を退ける」だけの思想を持たねばならない。
・そして、これは被害者の側であるパクられ側にとって労力でしかない。クレームチャートを用意する手間や、モラルが低い無敵の人とのやりとりに精神を削られること(意味不明な言い訳への応酬や、後々の執拗な逆恨みなど)を考えれば、触れずに泣き寝入りしてきた者も多いだろう。

・この「照合の困難さ」と、「創造性に関する知見に基づく反論材料の覚束なさ」とは、そう安々と解消されるものではないため、裏切り者が甘い汁を吸える、このゆるい感じはしばらく続いていくだろう。

 ◇  ◇  ◇

・とはいえ、何だか少し気持ち悪い。いやはや、何とかならないか、と言いつつも、クイズ問題は膨大で多種多様だ。量が多い。
・その量は、界隈の賑わいに応じてウナギのぼりだ。それらを古今東西すべて把握するなんて、そんな技術は実現可能だろうか?
・また、創造性だ、オリジナリティだ、と一口に言っても、色んな考えがあって定まらないのではないか?ふむ。困った。

・そこでQuizologyですよ!みなさん!
・困った時のお悩み窓口。Quizologyに相談ぢゃ😇

・ということで、Quizologyの知見を、少し覗いてみると、これらの問題を一挙に解決した事例があった。アイデアというのは、複数の問題をいっぺんに解決することだというのは、任天堂の岩田社長の言葉であったか。
・ただ、現実的におおっぴらにするには、ちょっと問題がある。なぜなら、こちら側の世界では、まだ環境が整備されていないからだ。Quizologyの世界線とは異なり、このアイデアに伴い発生する諸々の問題をカバーする仕組みが整っておらず、既存の価値観が壊しっぱなしにされかねないのだ。
・実際に、……と別の世界線での出来事に対し言うのも変な話だが、Quizologyの世界では、そのアイデアは既存の価値観に創造的破壊をもたらし、波乱を呼んだようだ。

・1999年の7の月。終末論があふれた世界に突如あらわれた、偽名によるアンゴルモアの3大論文がひとつ。その名も「森羅万象データベース」
・古今東西、総てのクイズ問題を含め、クイズに関するあらゆる事柄を網羅する、クイズ界のマザーブレインである。レベル5に至ったデータベースでは、保存されたクイズ問題の検索・閲覧機能だけではなく、クイズ問題の作成、出題用のクイズ問題の選定、記録の作成、競技者のレーティング設定等と、そんなん無理やろと思われていた数々の高度な機能を備えており、このデータベースの実現により、津々浦々のクイズシーンは劇的に変わってしまったそうだ。
・一部は、ペンペン草はおろか、種もまかれない死の砂漠と化し、オアシス都市の住民たちは、創造力と一心に向き合う狭き試練の地へと、移住せざるを得なくなった。
・一部は、それまで遠く眺め、惑い、オアシスを羨望するしかなかった荒野を、知的好奇心があふれる快楽の園へと変えた。
・そして、レベル5のデータベースが未だ届くことができなかった領域に佇む者は、今までどおりに変わらず、知的な問答に興じた。

・しかし、そんなことが現実に可能なのだろうか?そして、森羅万象データベースは、クイズ問題の盗用問題をどのように解決したのだろうか?
・ざっくりとだが、論文の内容を読み解いていこう。

〇森羅万象データベース
・アブストラクト。まず、背景だ。
・クイズをより楽しむうえでは、数々の欠かせないリソースが存在する。いわゆる「クイズ企画の9要素」として整理されているそれらの中でも、「クイズ問題」はその中心をなしており、「問題集デバイド」や「クイズ問題の盗用問題」等、クイズ問題まわりの話題には、クイズをより楽しむことを阻害する諸々の困りごとが転がっている、と。

・ふむ、そうさなぁ。んで、次はデータベースって何さ?って話か。

・データベースとは、現実に存在するもの(エンティティ)についての単なるデータを、目的に合うよう扱いやすい形に揃え、まとめたものだと。ふむ。

・クイズ界隈に関するデータベースは様々あるけど、全体像を概観してみると、「クイズ問題」、「クイズ形式」、「クイズイベント」、「クイズプレイヤー(組織)」、「クイズ媒体(資料)」といったエンティティに対応したデータベースがあり、それらは、クイズをより楽しむことを阻害する諸々の困りごとに対し、様々な解決策を与えているとな。にゃる。

・ここらへんは、Quizologyの世界じゃなくても、実現されてるのはあるよねぃ。
・クイズ問題が欲しければ、少し古いけど「クイズの杜」、クイズのイベントが知りたければ「新・一心精進」という凄いサイトがある。一方で、「クイズ形式」や「クイズプレイヤー(組織)」、「クイズ媒体(資料)」については、有力なサイトは何処にも無い。こちらでも、クイズ形式@wikiや、クイズプレイヤー名鑑、クイズ図書目録なんかがあれば、何かと便利なんだけど、いろいろ壁があるだろうし、旨味も無いもんね。むべなるかな。

・んで、これらにはデータのまとまり具合や操作の可動性によってレベルがあり、高次になるに従い、「クイズ問題」を中心としたデータベースへと統合されていくとな。ほぅ。面白くなってきたぜよ。
・そして、この論文では、その「クイズ問題」を中心に統合、高度化していくデータベースの構想と、それを実現するための技術について記述し、諸々の問題の解決にどのように資するかを論ずるそうな。

・ふむ。目的もわかった。
・気になる続きを、詳しく見てみよう。

  ◇  ◇  ◇

・先ずは、全体の構想を順に追っていくようだ。
・データベースは、レベル1からレベル7まであり、レベル4以降が、森羅万象データベースと呼ばれるものらしい。

・レベル1のクイズ問題データベースは、単なるデータの寄せ集めだ。というと正確ではない。
・クイズ問題集やクイズ番組の動画をひたすら集めた資料の山のように、目的のデータ(ここでいうと、クイズ問題の問題文とこたえ)が含まれてはいるものの不要なデータも含まれた資料の寄せ集めは、レベル0のデータベースにあたるようだ。
・このレベル0の元資料から目的のデータ(一組の問題文とこたえ)のみを抽出したものが、レベル1のクイズ問題データベースであり、紙の単語帳の表側に問題を、裏側にこたえを書いたものなんかが、このイメージに近い。

(画像)

・そのひとつ上のレベル2は、レベル1のデータベースに「検索機能」が加わったものだそうな。機能が加わるので、厳密にはデータベースシステム(DBS)と呼び分けるべきだろうが、世間一般の呼びやすい方に寄せ、以降のレベルも、単に「データベース」と表記する。
・これは、エクセルに問題と答えの組を、ザーッと入力したのなんかがこれであろう。Ankiのデッキでもよい。デジタルデータのものは、大抵はエジェターに検索機能がついているので、レベル2となる。
・レベル2のものは、既にそんじょそこらにありふれていて、個人で作ったエクセルファイルから、有志で構築したデータベース、中にはWebで公開されているものもあり、規模は様々だ。
・このデータベースは、網羅性を高めるように規模(データ数)を増やしていくと、極論、今までに出されたクイズ問題すべてとなりそうだ。仮に、これが実現できれば、先に上げた「照合困難」による障壁は、クリアーできるように思える。
・クイズを作ってみたよ!じゃあ、被っていないか確認してみようか!クイズ問題をデータベースの検索窓に打ち込むよ!「(照合中…、照合中…、)、検索結果:3件 が該当します。」なんてことが可能となるのではないか。

・これで一件落着のように思えるが、「創造性に基づく峻別」の問題が残っているほか、そもそもの「照合の困難さ」も一部分しか解決していない。

・例えば、次のクイズ問題を考える。

Q1.フランス語で「稲妻」という意味のお菓子は何でしょう? A.エクレア

・Q1の例題をレベル2のデータベースで検索にかけると、どうなるだろうか?
・おそらく、数百件ヒットするだろう。abcやクイズロードカップなど、いくつもの問題集がヒットするはずだ。ヒットしたのだから、パクリ認定できそうなものだが、どうか?
・たぶん、実際にパクった事案は発生していないだろう。なぜならば、Q1の例題は、事実の組み合わせを、よく使われる言い回しで表現したにすぎないため、「同じような発想で作ったら、たまたま同じになった」という事態が容易に想定されるためである。
・いわば、本当はパクっていないのにパクリ認定されてしまう偽陽性、第一種過誤である。この点、「創造性に基づいた峻別」ができていない。

・また、文章をちょっと変えてみよう。

Q1’.仏語で「いなづま」の意味。チョコがかかったお菓子は? Ans.エクレア

・使っている着想はQ1と同じだが、言い回しが違っている。ここまで変えなくても、文末表現を変えただけで「何でしょう?」「何?」「何か?」「なんであるか?」と他に4種類も挙げられる。これらは検索上は別のものとして区別されるが、意味としては一緒のものだろう。
・そのため、実際には問題集から一部の表現を変えただけで盗用していたとしても、Q1'.を検索した結果が、0件ヒットならば、検出できずパクリ認定できないことになる。いわば、偽陰性、第二種過誤である。この点、「照合の困難さ」を解決していない。

・このように、「偶然被ってしまったものを峻別する基準がない」ことや、「同じ素材を用いているが、表記ゆれ等で表現が異なる場合に検出しきれない」といった問題が、レベル2のデータベースでは残ってしまう。

・また、次のクイズ問題については、どうか?

Q2.バ美肉って何の肉!? Ans.バーチャル美少女

・これは、2020年9月5日に、みんなで早押しクイズで実施された、quizwitchさんの募集企画で、私が提出し、出題されたクイズ問題だ。
「ドラえもんの誕生日」を訊ねるポエムクイズを提出したところ、問題文が長すぎてNGを頂いたため、「みんなの対戦クイズ(通称:みんクイ)」の大喜利で翻弄された悲しみを乗り越えて、急遽、真逆の問題を提出し、見事成功した問題だ。

・勘のよい方なら察したであろう。これは、バラエティ番組「トリニクって何の肉!?」をパロったクイズである。誤答選択肢には、「ニワトリ」の「ニ」、「トリ」の「ト」、そして「ペンギン」の「ペ」を入れ、内輪ネタも完璧である。なんて、邪悪な問題なんだ🔥🐧。
・他の人の提出問題が、企画の性質上、わりと長めの問題文ばかりになるだろうと見込んで、場があたたまってきた後半にポッと出題されて、意表をつくのを狙った問題であり、この場のコンテキストがあって面白みが成り立つクイズ問題であった。

・このクイズ問題については、例えば、次のようなクイズ問題に書きかえても、使っている事実ベースの情報は同じである。

Q2'.YouTube界隈で使われる「バ美肉」といえば、何ということばの略でしょう? Ans.バーチャル美少女受肉

・このクイズ問題は、検索をかければ、数10件はヒットするだろう。
・これを先ほどのQ1で挙げた第一種過誤をおこさないようにと、Q2もQ2’も一緒だとしてしまえば、パクリ認定されてしまう。

・しかし、パクリかパクリじゃないかなんて、実際にその人の頭の中や犯行現場を覗けるわけがないので、確かなパクリ認定などしきれない。

・いずれにしても、ただ、古今東西の総てのクイズ問題を集めただけのレベル2のデータベースでは、この「パクり・パクられ」の判定はできないのだ。
・現在のクイズ界隈は、この状態といえる。ゆるくチェックされ、ゆるく共有される。そして、なんとなく創造性が尊ばれる。

・一方で、Quizology上では、アンゴルモアの三大論文による創造的破壊により、これは問題ではなくなった。オリジナリティが低いクイズ問題方面の話でいえば、パクリ認定が可能となったのではなく、そもそも、パクったり、パクられたりする意味合いが消え失せてしまったのだ。
・そこまで行く前に、論文の内容に戻って、まずは、「表記ゆれを検出できない」問題を、どうやって解決したか、レベル3のデータベースについてみていこう。

  ◇  ◇  ◇

・レベル3のデータベースは、リレーショナル・データベース(RDB)だったレベル2のデータベースを、オブジェクト・オリエンテッド・データベース(OODB)に整理したものだそうだ。そして、これはある意味で90年代前半のQuizologyの研究成果の粋であるともいえる。
・野間音二郎によって提唱されたOFPmモデルとは、物事(Object)を、ある切り口(Facet)で見ると、特性(Property)が表れるという物事の捉え方であり、図書館学五原則で知られるインドの図書館学者ランガナータンが制定したコロン分類法に着想を得て生み出したものである。
・この捉え方によると、先ほどのQ1のような細かい言い回しで違う種類の問題を同一のものとして整理できる。例えば、次の問題(再掲)

Q1.フランス語で「稲妻」という意味のお菓子は何でしょう? Ans.エクレア

・という例題は、「エクレア」というObjectを中心とした、OFPの組み合わせとみなすことができ、(Obj:エクレア)、【語源:フランス語】稲妻、【何か?】お菓子、という情報に整理できる。(いわゆる「情報形」表現)
・この情報から一定の構文規則に沿って変換されたクイズ問題は複数考えられるが、用いているOFPの組と並びが一緒かどうかで同一性を判断することが可能となる。このように、OFPmの観点で整理したOODBとすることで、「表記ゆれを検出できない問題」を解消することが可能となる。

・一方で、このレベルでは、「偶然被ってしまったものを峻別する基準がない」という状態は依然として残る。
・Q2とQ2'の「バ美肉」の例題は、使っている事実の組み合わせは、(Obj:バ美肉)と【正称:バーチャル美少女】といずれも同じであり、このOFPの観点で比較するのであれば、どちらも同じものと判断される。
・しかし、Q2にはQ2’以上の何かが、違いがあるように感じられる。OFPを越えた何か、単なる事実の組み合わせを越えた何かがあるのではないか。それこそが、創造性につながる何かではないのか?

・ここらへんに、90年代前半のQuizology研究の知見の粋が詰まっており、いわゆる「創造性とは何か?」という基準になってくる。ここを詰めて、実装していくと、レベル4の森羅万象データベースに移行することとなる。(って理解でいいのだろうか?)

・レベル4の森羅万象データベースは、レベル3のクイズ問題データベースに、OFPmモデルの「m(メタパタン)」の部分が拡張され扱えるクイズ問題の範囲が広がったほか、統語論研究の知見により、情報形を変換規則に沿って具体形を生成できるようになったもの、らしい。何だか、言っている意味がよくわからない。

・よくわからないが、この段階になると、先ず、「偶然被ってしまったものの峻別」ができるらしい。
・「m(メタパタン)」という要素がどの程度くっついているかを基準として、クイズ問題のオリジナリティを判断できるそうだ。Q2の例題でいうと、「トリニクって何の肉!?」のパロディとなっているとか、トリを焼いて食べることが邪悪とされネタにされる界隈で出したこととかがm(メタパタン)に入ってくるのだろうか?
・んで、データベースに最初に登録された人が、その問題の発明者となる。たしかに、これなら、森羅万象DBが登場する前はともかく、クイズ問題を誰でも検索できるようになっているので、偶然被ったとしても、先に考案した人がいる以上、自作であれどオリジナリティは主張できないよと。ふむ。

・いや、読み取り方が違ったな。コンテキストが違えば別のものとみなされる芸術作品のように、オリジナリティ判断はできるんだけど、一方で、偶然被ろうが被らまいが、それを自作として主張する意味合いが薄れてしまったんだな。
・やったー!このクイズ問題を思いついたぞ!と、なったときに、確かに別にパクってはないんだけど、それなりにオリジナリティが認められる同じクイズ問題を先に思いついてデータベースに登録した人がいるから、検索して探せる以上、それを使う時には、自分で思いついたとは言っていいけど、先に思いついた人にリスペクトしなさいねという世界なのだ。
・そして、オリジナリティが認められたクイズ問題もデータベースから検索できる以上、クイズ問題を盗用が意味をなさないのだ。正直に、データベースからよさげな問題を引っ張ってきましたといえばよい。そして、それを自作だと主張しても、すでに共通のデータベースに発明者が記載されているため、皆にすぐにばれてしまうのだ。
・もっというと、レベル4から5に至る途中で、「出題者の知識レベルに合わせたり、企画の趣旨に合わせたクイズ問題の選定」の機能も実装されるそうだ。こうなると、自分で問題を作る意味というのが何かわからなくなってくる。
・謎の技術だが、そんなこと可能なのだろうか。。まぁ、理論上はできなくはない気がする。現実に、それを可能にする環境構築が難しいだけで、遠くない未来に、こちら側でも技術の側からやってくる気もする。

・「誰でもクイズ問題を入手できるようにする」ことで、「パクり・パクられ」といった次元のお悩みを無に帰したのか。なんて力技だ。。
・それこそ、誰かが作った問題を公開するようなものだが、情報形→具体形という事実の組み合わせとすることで、これもクリアーしている。一方で、事実の組み合わせ以上のオリジナリティあるクイズ問題については、発明者としての名誉を与える形で、上手く取り込んでいる。
・本当にこのような技術が可能であれば、まさに創造的破壊だ。他人の問題の丸パクリでお菓子代を稼いでいた人々は駆逐され、さらに言うと既存のクイズ作家は求められる「創造性」に、より近い所で向き合い続けなければならなくなるので、苦難の道に晒されることとなるだろう。クイズ問題の研究が容易となり、ゆるゆるのわれらの楽園は、枯れ果てた砂漠になるのではないだろうか。おそろしい。

・しかし、古今東西のクイズ問題が誰でも入手できるようになり、被ったかどうかも検索できるのであれば、みんな「作問なんて、や~めた!」となるのではないか。作ったってどうせ被るのだし、コンピュータのウィザードに従ってポチポチ押していけば、いい感じのクイズ問題も用意できる。ならば、わざわざ、うんうんと頭をうねらせて大変な思いをしてクイズの問題を作らずともよいのだ。人類が作問にあてる時間は激減するだろう。
・……だが、これでは困るのではないか?作問技術に関する進化のはしごが外されてしまう。被っているかどうかがわかり、未開拓の分野の作問に集中できるようになったとはいえ、未開拓を切り開く能力がなければ閉じてしまう。
・ここらへんは、おそらく問題ないだろう。作問は、おそらく別のあそびとして確実に残るはずだ。なぜなら、作問自体に楽しさが宿っているのだから。問いかけ、当たりをつけ、探索する。当たりの付け方と、探索先のデータセットが、共有化され強化されたと考えれば、今現在の延長線上にあるような気がする。
・製作中のTTRPG『劇場版 みんなで早押しクイズ』の世界のように、あえて車輪の再発明にインセンティブを持たせる仕組みが取り入れられた電脳世界になる可能性も無いわけではないし。うん。

・レベル5以上についても書かれているが、こちらもますますよくわからない。因果ネットワークがどうのこうの、東洋的な問答観、問い答えること自体の意味とか、わけがわからないことばかりが書かれている。
・とりあえず、「クイズ問題の盗用」の問題について、「古今東西のクイズ問題を全公開すること」と「オリジナリティの基準を作って発明者を称えること」とで解決できそうなのはわかったので、ここまででいいだろう。

・まぁ、まだまだ現実にはならないのだ。この、ゆるい世界で、度々おこる、同じような騒動を微笑ましく、ココアを飲みながら気長に眺めることとしよう。(終)

もしこの雑文が良かったなと、役に立ったなと、他の人にもおすすめしたいなと思ってくれた人は、高評価・コメントをしてくれると非常にうれしいです。最後まで見てくださり本当にありがとうございます。では、次の雑文でお会いしましょう。ノシ