見出し画像

『源氏物語』をデジタル時代に読む(1)ネットワーク分析I

 平安時代より数世紀にわたり日本人が書き写してきた作品、『源氏物語』。
 印刷技術が未成熟だった時代には一文字ずつ人の手で書き写されていた『源氏物語』ですが……
 21世紀。20世紀に誕生したインターネットも情報通信技術も、スマートフォンと共に万人の生活に普及しました。もはや『源氏物語』を写経する必要はありません。
 テキスト情報だけなら誰でもデジタル空間で取得可能です。デジタルデバイスで読むもよし、目が疲れたら紙に印刷するもよし。本で買ってもよし。
 古文で読んでも現代語訳で読んでもよし。
 作者の紫式部も「いとあさまし」と驚き呆れるのではないでしょうか?

 そんな21世紀ですが、デジタル技術によって様々な「計算」が可能になったのも御存知の通りです。少し世を見渡せば「計算式は全く分からないけれど計算された数字」が沢山あります。
 平安時代には数字と無縁に詠まれていた和歌も、いまや「AIが計算して詠みあげる」ような時代です。「いとあさましき」時代です。

 そういう時代に『源氏物語』を読むので、『源氏物語』を計算しようというのが今回の企画です。

 一体何をどう計算するのか?
 人文情報学(Digital Humanities)という分野では、例えば使用語句を計量して、全体の文体の推移を割り出したり、語句の使われ方から単語ネットワークを作ったりもするのですが、ここでは登場人物のネットワークを計算してみたいと思います。それによって改めて分かることもあります。例えば……
・物語の中心は誰か? (色々な「中心」があります)
・中心に近いのは誰か?
・誰が人々を結び合わせているか?
・誰が噂話の種にされているか?
・あの人物がこんな役割の位置にいたとは……!
等々。他にも分かるかもしれません。

 計算するにはデータが必要です。ここで必要なのは登場人物の関係データです。データセットは用意する必要があります。
 『源氏物語』という作品において、登場人物同士の関係はどうすれば定義できるでしょうか。
 例えば以下のような関係が考えられるのではないでしょうか。

・兄弟姉妹
・対面した
・お互いの顔を見ないで会話した
・見た
・手紙を送った
・セリフの中で言及した

 他にもあるでしょう。
 ここで「関係の向き」について説明したいと思います。Aさん、Bさんが二人いるとして、二人の関係には向きがあるものとないものがあります。
 上の例ですと、

・AさんがBさんに手紙を送った

という関係であれば、

  A → B

といったような方向が意識できるでしょう。
 同様に、Aさんが会話の中でBさんの名前を挙げていたら「A → B」という方向性を感じます。

・AさんがBさんを見て、最初はBさんは気づいていなかった。でも数秒したらBさんも気がついた

このような状況でしたら、

  A → B  B → A

と二つの方向を想定できますし、

  A ⇆ B

とまとめてしまってもよいでしょう。
 こうした「二人の人物の関係の矢印」を集約して繋げると、下のようなグラフを描くことができます。

筆者が『源氏物語』の「空蝉」の人間関係から描いた
ネットワーク。具体的にどのような関係で矢印を設定
したのかは次回解説いたします。

このように矢印が有るネットワーク(図)は、有効グラフと呼ばれます。

 そして「方向がある関係」があれば、方向が無い関係も当然あります。今回の記事のサムネイル画像もそのような関係のネットワーク(無向グラフ)を描いたものです。
 例えば、AさんとBさんが「対面した」「お互いの顔を見ないで会話した」といった関係には方向性が感じられません。勿論、会った瞬間はどちらが先に相手を見たとか微妙なタイムラグも考えられますが、「物語」というのは多くが過去形で語られます。『源氏物語』然りです。虚構の作り話であれ、一応は過去の話ですから、「二人の人物が出会った」と伝えられてしまえば、その情報には方向性をもはや感じられません。向きも有るのか無いのか微妙な所ですし、データセットを無向関係で統一するなら「A ⇆ B」のようにしてもよいわけです。

 では「兄弟姉妹」といった関係に「向き」はあるでしょうか。
 家族が中心の物語で人物相関図があると、兄弟姉妹は横並びになっていることが多いです。英語だったら'brother'、'sister'と生まれた順は気にしない。だから「向き」のようなものはない。
 それとも生まれた順に、例えば「長男→次男→三男→末っ子」のような矢印を設定したものでしょうか? なんだか時代錯誤な感じがしますが、時代が違えば尤もなのでしょうか?
 結論としては、この問題に唯一絶対の答えはありません。

 この問題意識から「ネットワーク」というものの本質に踏み入る議論が始まります。
 「デジタル」や「データ」というと、どうしてか「唯一絶対の正解」があるような気がしてきます。
 現代日本人の私達が想像し易いネットワークの一つに、SNSのフォロー・フォロワー関係が考えられるでしょう。アカウントAとBがあり、AがBをフォローしていれば「A → B」と定義する。始めたばかりのアカウントで考えると、Aをフォローするアカウントは1〜100くらいでしょう。しかしインフルエンサーのアカウントを見てみると数十万から数千万のアカウントがフォローしています。フォローしているアカウント同士にもフォロー関係は存在します。そんな具体的にはイメージできないものの、ぼんやりとはイメージできる巨大な関係性としてのネットワークが想像できます。そのネットワークには唯一絶対のネットワークグラフがあるに違いない。少なくとも、ある瞬間についていえば一つに同定できる。……そういったイメージがあるので、「登場人物のネットワーク」にも唯一絶対のグラフがあるのではないかと思えてきます。
 あるいは私達が学校で四則演算や方程式をたくさん解いてきたから、数字の問題になるとただ一つの形があるのではないかという感覚(期待)が現れてしまうのかもしれません。

 しかしネットワークのデータセットに、唯一無二の正解があるとは限らないのです。
 デジタル空間のフォロー・フォロワー関係であれば、その背景には「現実の端末同士の具体的な通信」があります。その通信関係を表現したネットワークは、(認識は困難ですが)唯一の現実の関係性に対応するでしょう。
 あるいは具体的な物・存在同士の関係性、例えばミツバチが花から巣へと蜜(栄養資源)を運ぶような移動も、ネットワークにすれば(神のみぞ識る)唯一のネットワークでしょう。

 しかし「物語の登場人物のネットワーク」は唯一には定まりません。既に見たように、人物(人間)の間には幾種類もの関係が想像できます。愛であったり敵意であったり取引関係であったり同じ集団であったり、全て言語化するのは疲れますし、実際に言語化しようものなら、十人十色の異なる言葉が出てくるでしょう。複数の関係性を一つのグラフに押し込めれば、忽ちおどろおどろしい、理解に苦しむ絵が浮かび上がるのは想像に難くありません。よく見る「物語の人物相関図」は、人物同士の関係性を1~3種類しか取り上げません。だから「理解できる」のです。

 物語の登場人物のネットワーク分析も、同様に恣意的ならざるを得ません。登場人物の間には、言語化できない関係性も含めた幾種類もの関係がありますが、「理解できるネットワーク」において計算できる関係は1-3種類くらいでしょう。全ての関係性を一度には「理解」できないのです。
 尤も、これは既存の文学研究にも言えることで、ある観点から議論すれば、別の観点からの議論は「別の機会」に譲らなければ、何の話か分からなくなります。「別の機会」は、別の文献、別の章、別の段落、別の文と文体次第ですが、人間の知能であれば観点は絞る必要があります。

 無味乾燥に言えば、物語の人物ネットワークとは「物語文という長い文字情報に対して、ある関係性を定義して、その定義に従って文字情報から作成した別の情報」ですから、ネットワークグラフの描き方は定義の数だけあると言えます。
(それでも敢えてネットワークを描いて、計算処理する意味があるのか? というのは私の近年の論題です。しかし文学研究で論述の理解可能性において「巧い観点」が想定可能なように、ネットワークにも「巧い定義」は考えられるのでしょう。)

 そして関係性のルールを定義しても、依然として「解釈」をしなければならない瞬間は訪れます。それ故に作成者の数だけ描き方があるとも言えるわけです。例えば「どっちを指しているのか分からない代名詞」といったものは、古典的作品(名匠の作品)であっても、一作品に一つくらいはあるものです。
 あるいは主語・目的語などが省略されている時。『源氏物語』に限りませんが、日本語で書かれた物語文では珍しいものではありません。話者・行為者が特定できる場合も多いですが、時々解釈が割れる文章が存在します。そうした文章もあるので、「関係性データの抽出をLLM-AIに投げる」というのも全面的にはできません。プログラムによる自然言語処理で得られるデータセット以上に、LLM-AIに任せて得たデータセットは、その妥当性の確認・検証で人間が作品を精読する必要性が高いでしょう。AIの性能が高ければ「データ入力の手間が省けた」と言える時もあるでしょうが、メチャメチャなデータセットが出力されることも考えられます(2024年2月現在は、そうなる方が想像し易いです)。……まあこの問題は、この企画が長期化すれば(たぶんしますが)状況が変わるかもしれませんし、とりあえず横に置いておきます。脱線してしまいました。
 「関係性を定義しても解釈が求められる」話に戻りましょう。
 他にもあります。例えば「二人の人物が互いを認知した時」を関係性として定めるとします。この定義で関係性を拾いながら、フリードリッヒ・シラーの『ヴィルヘルム・テル』という物語を読んでいくと、テルによる悪代官の暗殺が描かれています(第四幕三場)。

ゲスラー         これはテルの矢。
 は馬から滑り落ちてルードルフ・ハラスの腕の中に。そして腰掛の上に下ろされる。

Friedrich Schiller: Wilhelm Tell. 1804. 2792行目。

馬に乗っていた悪代官のゲスラーが、矢に射貫かれて馬から落ち、それを従者が抱き留めて横たえたという場面です。ゲスラーは、自身を射抜いた矢を放ったのがテルという人物だと確信しています。読者(観客)の目にも、射たのは実際にテルだと分かっています。しかしゲスラーの視点で考えると、彼の五感が認識したのは「矢」であって「テルという人物」ではないのです。このような場合に、ゲスラーはテルを「認知した」と言えるでしょうか。
 唯物主義的観点に立てば、ゲスラーが見たのはあくまで「矢」ですから、テルのことは認知していません。だから「ゲスラー ⇆ テル」という関係をデータに加えない。
 しかし他方で「テルは弩の名手」という一種の象徴性は、作中で繰り返されるモチーフです。テルは13世紀スイスの伝説上の人物で、「子供の頭に乗せたリンゴを射抜いた」という物語が付帯されています。ゆえに『テル』が物語であることを踏まえ、「矢」はテルという人物の象徴であり、テルの一部が如く見なすならば、「ゲスラー ⇆ 矢(≒テル)」という関係をデータに反映させることになる。
 これは解釈の問題であって、正確さの問題ではありません。一応この一場面のために関係性のルールを細かく書くことも不可能ではありませんが、少なくとも『ヴィルヘルム・テル』で「暗殺」や「矢によるコミュニケーション」などは上記の場面ただ一つなので、あまりルールを細かく書く意義はありません。

 その他の解釈の問題としては「端役」の扱いが挙げられるでしょう。雑に言えば「村人A・B・C・・・をどこまで区別するか?」といった問題です。『源氏物語』であれば、全篇数えれば「女房」と呼ばれるキャラクターはさすがに26人以上いそうな予感がします。この企画では「女房1(空蝉)」のように章毎に番号をリセットしてデータにする予定ですが……
 『源氏物語』は「人物リスト」が「紫式部の著作物」に含まれていないから、こちらで決めるしかありません。しかし例えばシェイクスピアなど西洋文学の戯曲作品となると、脚本の最初に作品の一部として「人物リスト」が付いてきます。そこに「騎士たち」とあったら、どこまで区別しようか?と迷うわけです。戯曲のト書から人数を算定できることもありますが、できないこともあります。それも踏まえて、データの取り方も著者の「人物リスト」に従うか、ト書を踏まえて戯曲の上演に必要な役者(の人数)に合わせるかと選択を迫られるわけです。(この選択の影響差がどの程度なのかは今度検証してみる予定です)

 以上のような点を踏まえて、物語の人物関係からネットワークを描くという問題が考えられるのですが、実際に描いた後には中心性や分散をはじめ、様々な数値が計算できます。だから「端役」の人数が気になってくるわけですが………
 それでも人物が増えれば、大まかな傾向としては大差がなくなると期待できます。三国志の物語で周瑜ほどの中心的人物が二人になったら結構な誤差が生まれそうですが、三国志の規模の物語では、村人が一人増えても減っても、物語もネットワークも大差は無いでしょう。勿論5人くらいの物語だったら大きな誤差になってしまいます。『源氏物語』も「空蝉」だけだと11人です。一人の端役も数値に影響を及ぼすでしょう。しかし全篇を総合すれば数百人に及びますから、端役については目をつぶれるようになりそうです。
 尤も十人前後の物語では、直接文章を読んで何かを考える代わりに、人物ネットワークを分析して得られた数値を介して何かを考えるメリット自体があまり感じられないわけですが(これは議論の余地があるかもしれませんが、とりあえず直感的には感じられません)。

 さて話が随分長くなってしまいました。未だ「空蝉」のネットワークの解説が始まっていませんが、前置きがここまで伸びてしまったので、今回はとりあえず概論ということで筆を置きたいと思います(上手く整理できているとも思えませんが)。ここから中心性係数とかの話をしていてはいつまでも本題に入りませんし(私も適任ではありませんし)、次回こそは「空蝉」のネットワークの解説に入りたいと思います。
 引き続きよろしくお願いいたします。


 ここからは蛇足・宣伝ですが、この記事のテーマである「文学作品をネットワーク分析する」のとは逆に、「ネットワーク分析を文学化する」といったことを個人的にやっています。
 例えば下の記事に「探鳥会」(バードウォッチング)といったサブタイトルを付けていますが、「鳥」ほどネットワークのシンボルにしたら面白い言葉もないわけです。人間が船を発明する前は、鳥だけが海を越えて、複数の生命のネットワークを繋いでいたのですから。


この記事が気に入ったらサポートをしてみませんか?