見出し画像

日本の古代の地名の発音の傾向

背景

「上野」(こうずけ)。完全にうえのだと思っていました。群馬の昔の名前です。[上野国 - Wikipedia]の話をかいつまむと、こういうことらしいです(順番は違うかもしれない)。

  • "けの" (毛野)

  • --(上下分割)--> "かみつけの " (上毛野)

  • --(漢字2文字化。好字令?)--> "かみつけの" (上野)

  • --(i脱落+連声濁?)--> "かむづけの" (上野)

  • --(音便?)--> "かうづけの" (上野)

  • --("の"脱落)-->"かうづけ" (上野)

  • --(auが長母音化)--> "こーづけ" (上野)

  • --(づとずの共通化)--> "こーずけ" (上野)

  • --(現代仮名遣い)-->「こうずけ(上野)」

出発点の毛野は古墳時代にさかのぼる古い名前で、これ自体はわりと普通の地名という印象で難読地名でもないですが、時間がたつとこんなことになっちゃうんですね。ちなみに"つ"は上代日本語の格助詞、下野(しもつけ)はおよそ栃木県になります。

それで、地名の古い発音に興味を持ったわけですが(強引)、日本の地名の最古級の記録と思われるのは「三国志」中の「魏書」中の「烏丸鮮卑東夷伝」倭人条(通称: 魏志倭人伝[三國志30]) でして、3世紀の日本列島の状況を伝える貴重な資料として知られます。魏志倭人伝には当時の倭の近辺にあった国名らしきものが30件(+朝鮮半島に1件)出てくるのですが、「〇奴國」(〇ナ? 〇ヌ? 〇ノ?こく)というパターンの国名が30ヶ国中9ヶ国=30%も出てきて、不自然だといわれております(2回の「奴国」を含む)。
これについて[安本2003]において「ナ行を語尾に持つ九州の古代の地名(郡名)は5%強しかない」ことが指摘されていて、「へえ」と思った次第であります。

「ナ行を語尾に持つ」というのは、典型的には「大野(オオノ)」「浜名(ハマナ)」みたいなやつです。個人的にはむしろメジャーな名前だと思っていたので、そんなわけないやろ・・・と思いまして、実際にデータで確認してみることにしました。

方法

使用したデータ

和名類聚抄(略称: 和名抄)は平安時代の百科事典のようなもので、中に律令制下の行政区画である国、郡、郷の一覧があります[和名類聚抄 - Wikipedia]
。この文献は10世紀のものですが、多少の区画の改廃はあるにせよ、おおむね7-8世紀の行政区画の情報が含まれていると思われます。上記のデータセットは和名抄から郡以上の区画を取り出してふりがなをつけたものです。平安時代の仮名なので濁点が多くの場合省略されています。594件。

国造(くにのみやつこ、こくぞう)は古墳時代(4-7世紀)ごろにあった地域支配の単位またはその首長です。Wikipediaのデータの元ネタは「先代旧事本紀」中の「国造本紀」になります。これは平安初期(9世紀初め)の成立とみられますが、国造に関する部分はおおむね史料価値があると考えられています。大きさは典型的には郡より大きく、令制国より小さいです。139件。

陳寿 (3世紀末ごろ)による「三国志」中の「魏書」中の「烏丸鮮卑東夷伝」倭人条(通称: 魏志倭人伝) に3世紀前半の倭にあった国名の音訳とみられる30ヶ国(狗邪韓國を除く)が記載されています。時期は3世紀前半と思われます。それらの当時の正確な発音は不明なため、今回は地名の長さだけを測ることにします。30件。

処理方法

前処理は以下の通り。

  • 律令制郡名

    • 濁音のふりがなを清音に変換し、すべて清音に正規化しました。よってこのデータセットについては濁音と清音の区別はつきません。

    • 地域が分割されている場合は固有名詞部分のみを抽出しました。具体的には「上」/「下」「前」/「後」などの方位を表す組になっている場合はマージしてそれ以外の部分を地名としました。「{大地名}の{小地名}」のパターンの場合は大地名を除去しました。この結果データ数は582件となりました。

  • 国造

    • 漢字表記をもとに上代特殊仮名遣いの甲乙を手作業で復元しました。具体的には万葉仮名に対応する場合は万葉仮名とみなし、それができない場合は一般の単語とみなしてその甲乙をもとに復元しました。

    • 国が分割されている場合は固有名詞部分のみを抽出しました。方法は律令制郡名と同じです。この結果データ数は132件となりました。

  • 魏志倭人伝

    • 原文通りです。

律令制郡名のデータについては一部で地方別集計を行いました。やや恣意的ですが地方を以下のように定義します。大まかには古代の街道による分類を採用していますが、東山道と西海道は歴史的経緯を考慮し分割しています。

  • 畿内 (53)

  • 東海道 (129)

  • 東山道(東北以外) (66) : 下野、上野、信濃、飛騨、美濃、近江

  • 東山道(東北のみ) (47) : 陸奥、出羽

  • 北陸道 (31)

  • 山陰道 (52)

  • 山陽道 (70)

  • 南海道 (50)

  • 西海道(南九州以外) (56) : 筑前、筑後、肥前、豊前、豊後

  • 西海道(南九州のみ) (40) : 肥後、日向、薩摩、大隅

国造のデータについては件数が少ないため地方ごとの集計は行っていません。

集計処理は、上記前処理を終えたデータをCSV形式で保存し、Pythonスクリプトを書いてPandas DataFrameオブジェクトとして読み込み、DataFrameの各種集計関数を使用して統計量を計算しました。

結果

地名の長さ

地名の長さ(音節数)の分布。

こちらは音節数で見た地名の長さの分布です。漢字表記の文字数ではないです。国造、郡名ともに3音節が最多で、2音節-4音節で大半を占めます。一方、魏志倭人伝で1文字(漢字)==1音節としてカウントした地名の長さは2音節が突出して多いことが分かります。

時代が下るにつれ地名が増えるので、地名の音節の長さも少しずつ伸びているかもしれませんが、この差は中国語に音訳する際の音節の省略が主たる原因であるとみています。中国語は地名を含むほとんどの単語は1音節か2音節であり、3音節以上になると発音が難しいです。大雑把な見積もりでは魏志倭人伝の2文字の国名の4-5割ぐらいは省略前は3音節だったと考えています。

一方、日本の地名を漢字で表記すると、もちろん2文字が一番多いことが知られています[相田2009] 。これは713年の好字令(元明天皇による、地名に良い意味の漢字2文字を使うという勅命)の影響と考えられますが、国造名や木簡記載の地名(好字令前)と令制国・郡名(好字令後)を比較すると、この時は地名の発音はそのままで表記を2文字に縮めたと考えられます(1音節の地名の場合は2文字に伸ばしましたが1音節の地名はもともと少ないとと考えられます)。よって、音節数ベースで数えれば長さの分布に対するその影響は軽微と考えられます。

「カ」がつく地名と「ハ」がつく地名

よく使われる音節の種類(発音)を調べました。地名の長さにかかわらず、ある音がある地名に1回以上出現すれば1件とし、全地名の中である音が含まれる地名の数の割合を調べました(なので全部の発音で合計すると1を超えます)。いずれも濁音と清音の違いは無視しています。

国造の名前によく使われる音節(上代特殊仮名遣いを考慮)。ベスト10。

$$
\begin{matrix}
音節 & 件数 & 割合(\%) \\
か0 & 29 & 22.1 \\
は0 & 27 & 20.6 \\
く0 & 18 & 13.7 \\
し0 & 17 & 13.0 \\
い0 & 16 & 12.2 \\
つ0 & 16 & 12.2 \\
さ0 & 15 & 11.5 \\
た0 & 15 & 11.5 \\
あ0 & 14 & 10.7 \\
き1 & 14 & 10.7 \\
\end{matrix}
$$

律令制郡の名前によく使われる音節。ベスト10。

$$
\begin{matrix}
音節 & 件数 & 割合(\%) \\
か0 & 172 & 29.0 \\
た0 & 125 & 21.1 \\
し0 & 96 & 16.2 \\
ま0 & 92 & 15.5 \\
は0 & 83 & 14.0 \\
み0 & 74 & 12.5 \\
あ0 & 71 & 12.0 \\
き0 & 61 & 10.3 \\
の0 & 58 & 9.8 \\
い0 & 57 & 9.6 \\
\end{matrix}
$$

まず全国で調べるとこちらの表のようになりました。トップはいずれも「か/が」です。これは上代日本語においてもともと出現率が高い音です。「は/ば」「し/じ」なども双方で上位に入っています。一方、「か/が」は律令制郡の方が割合は増えています。その他、比較すると「た/だ」「ま」が律令制郡の方でランクが上昇しています。国造と律令制郡では、時代の違いがあるほか、粒度も少し異なり律令制郡の方がやや小さい範囲となります。

恐らくこの上昇の原因は、「た/だ」は田(た)、潟(かた)、県(あがた)の一部で、「ま」は山(やま)、島(しま)などの一部で、一「か/が」は潟、県に加えて川(かわ)から来ていて、小規模な地名を増やす過程で合成語の一部として地名に入っているためだと思われます。しかし定量的な調査はできていません。

このうち、「か/が」と「は/ば」について、地方別に地名の割合を調べました。

地方別の「か」「が」を含む地名の割合(律令制郡)
地方別の「は」「ば」を含む地名の割合(律令制郡)

比較しますと、「か/が」の場合、全国にまんべんなく20-30%ぐらいの高頻度で存在するのに対し、「は/ば」の場合、地方によって割合に大きな差があることが分かります。後者はおおむね東日本に多いようで、次いで南海道となっています。その理由として例えばアイヌ語起源の地名とか、水田稲作の普及時期などが関連すると想像されますが、今のところ不明です。

ちなみに魏志倭人伝に登場する地名では自明に「は/ば」に相当しそうな字(百、巴)を含むものは30か国中2か国しかなく、平均値を大きく下回っています。これは魏志倭人伝のいわゆる「女王に属する国」の分布が東海道、東北、北陸道、南海道などの地方ではなく、西日本の特に山陽、畿内、九州などのエリアに偏っていることを示唆する可能性があります(字の発音についてはよく検討する必要がありますが)。

語末に「ナ行」がつく地名

$$
\begin{matrix}
音節 & 国造(\%) & 律令制郡(\%) \\
な & 0.76 & 2.36 \\
に & 0.76 & 0.50 \\
ぬ & 0.76 & 0.00 \\
ね & 0.76 & 1.01 \\
の & 4.58 & 4.05 \\
ナ行 & 7.63 & 7.93 \\
\end{matrix}
$$

本題の、語末にナ行がつく地名を調べます。全国平均では国造の場合で7.6%、律令制郡の場合で7.9%となっています。[安本2003]が指摘するほどではないですが、確かに割合は低く、魏志倭人伝の「〇奴国」の多さを説明できるほどではありません。

語末ナ行の地名の中でも最多は「の」(国造の場合は「の1」)です。漢字で書くと「野」「濃」が多いです(いずれも上代特殊仮名遣いでは「の1」です)。地名の語源としての意味はいずれもfieldの意味の野だと思います。

語末にナ行がつく地名の地方ごとの割合。

一方、地方ごとの割合はこの図のようになりました。これも地方によるばらつきがあり、極端なのは東山道(東北のみ) 0件、西海道(南九州のみ) 1件で、かなり低くなっています。その結果九州は全国平均より低く[安本2003]と整合的です。それ以外の地方はいずれも平均以上で極端な差はないものの東山道(東北以外)や山陰道がやや高めになっています。割合が10%程度ありますと"メジャー"なパターンと言ってよく冒頭の直観も地方によっては間違いではないです。気候・風土の違いやヤマト政権への服属年代の違いなど相関はありそうですが、なぜこのような地方による差が生じるのかについてはわかっていません。

魏志倭人伝に登場する「〇奴国」のパターンに対しての解釈については検討を要します。[安本2003]は「〇奴国」が多数出てくることは統計的にありえないとして「奴」字について(i)同じ鼻音であるマ行を表す場合がある、(ii)属格の格助詞「な」を表す(国名の一部ではない)場合がある、と解釈しています。しかし今回の結果から他の地方の割合が高い傾向を考慮すると、「〇奴国」が語末にナ行が付く地名であって、かつそうした地方にある可能性も検討してよいと思います ([補足: 二項検定]の節を参照)。今回は調べていませんが県主(あがたぬし)のリスト[県主の一覧 - Wikipedia]では語末にナ行が付く地名の割合は16%でした(ただしこのリストは網羅的ではない)。県主の分布は西日本-中部地方に偏っておりその起源は国造より古いと考えられるため、古い時代には語末にナ行が付く確率はより高かった可能性があります。これらの検証は今後の課題です。

まとめと今後

古代の日本の地名の発音(音節)の傾向について初期的な調査を行いました。データベースとしては律令制の郡と国造の一覧を用いました。またより古い地名が含まれるとみられる魏志倭人伝のものと傾向を比べました。分かったことは以下の通りです。

  • 音節の長さ: 国造、律令制郡ともに3音節が最多で、2音節、4音節が続きます。魏志倭人伝の倭の地名は2音節に偏っており、恐らく中国語風に2音節に短縮されているものが多くあります。

  • 使われやすい音: 「か・が」が最多です。ベスト10は国造と律令制郡で多少変動があります。律令制郡でみると「か・が」は全国的に出現頻度が高く「は・ば」は特定地方に多い傾向が見られます。

  • 語末にナ行のある地名: 割合は全国平均で国造7.6%、律令制郡7.9%で、最多は「の (甲類)」でした。律令制郡では、東北と南九州で極端に少ない傾向がありました。この結果は[安本2003]と整合的ですが、これらの地方を除く九州以外の地方は割合は平均以上でした。

現状は浅い調査にとどまっており分からないことが多いです。今後の課題は以下の通りです。

  • 濁音と上代特殊仮名遣いを加味したデータセットを作成しより当時の発音に近づけることが良いと思います。

  • 2-gram (隣接する2音節の組み合わせ)のパターンを調べたいです。合成語の一部として地名に取り込まれた2音節語の傾向が分かりそうです。語末にナ行が付く割合の変遷にも関係がありそうです。

  • この分野の既存研究がよく分かっていないのでサーベイが必要です。地名の由来・語源は多く調べられていると思いますが、発音に関連した統計などは何分野で調べられているのかよくわかっていません。古すぎて電子化されていないのかもしれないです。

補足: 二項検定

魏志倭人伝で「〇奴国」が頻出するのが偶然にしては多すぎることを確認するために、以下のような単純なモデル化を行います。まず仮想的な母集団として"日本語の地名集合"を考え、その大きさは近似的に無限大とします。魏志倭人伝に地名が登場することを(条件付き)ランダムサンプリングとみなし、試行回数$${N=30}$$とします。このうち語末にナ行が付く地名が出ることを"成功"とし、その1回あたりの確率を$${\pi}$$とします。成功確率$${\pi}$$は前述の律令制郡での割合から推定します。魏志倭人伝の国々が以下の範囲に偏っている場合を想定し検討してみます。

  • $${\pi=0.042}$$ 九州

  • $${\pi=0.091}$$ 東北・南九州以外の本州・四国・九州

  • $${\pi=0.135}$$ 東山道・山陰道

試行回数$${N}$$中、成功回数を$${n}$$、その期待値を$${E[n]}$$と書きます。今回、試行回数が小さいことから検定法として二項検定を利用します。

以下のテーブルは、具体的に$${N=30}$$および$${\pi}$$の各場合について、成功回数が$${n}$$以上になる確率$${p(n)}$$ (p値)を計算してみたものです。

$$
\begin{matrix}
\pi & 0.042 & 0.091 & 0.135 \\ \hline
p(n=5) & 0.008 & 0.132 & 0.381 \\
p(n=6) & 0.001 & 0.050 & 0.211 \\
p(n=7) & 0.000 & 0.016 & 0.100 \\
p(n=8) & 0.000 & 0.004 & 0.041 \\
p(n=9) & 0.000 & 0.001 & 0.015 \\ \hline
E[n] & 1.260 & 2.730 & 4.050 \\
\end{matrix}
$$

ここで成功回数$${n}$$の妥当な値ですが、魏志倭人伝では表面上9回の「〇奴国」が出現します。しかしその中に1文字の「奴国」が2回登場し、少なくとも1回目は律令制郡のデータでは筑前国那珂郡(なか)として記載されているため、語末にナ行が付く地名ではありません。これは前述の713年の好字令の影響とみられ、1音節の地名はほぼすべて2音節に変更されています。よって1文字の「奴国」は成功回数から除外し$${n=7}$$を採用します。

この場合、有意水準を0.05とすると、$${\pi=0.042}$$ (九州内)と$${\pi=0.091}$$ (東北・南九州以外の本州・四国・九州)のケースでは$${p \leq 0.05}$$となり統計的にほとんどありえない(ので地理的偏り以外の理由がある)と言えますが、$${\pi=0.135}$$ (東山道・山陰道)のケースだと$${p \gt 0.05}$$となり、そのような地方に魏志倭人伝の国々が偏っていれば偶然に7回以上「〇奴国」が出る可能性を統計的に否定しきれないです。もっとも、有意水準0.05も習慣的なものではあります。

参考文献

  1. [安本2003] 安本美典 (2003).『推理◎古代日本語の謎 「倭人語」の解読』勉誠出版

  2. [今井1998] 今井一江, 群馬県立女子大学北川研究室 (1998). 和名抄郡名一覧. http://kitagawa.la.coocan.jp/data/gunmei.html

  3. [和名類聚抄 - Wikipedia] https://ja.wikipedia.org/wiki/%E5%92%8C%E5%90%8D%E9%A1%9E%E8%81%9A%E6%8A%84

  4. [国造 - Wikipedia] https://ja.wikipedia.org/wiki/%E5%9B%BD%E9%80%A0#%E4%B8%80%E8%A6%A7

    • 主に先代旧事本紀 第10巻「国造本紀」に依っています。

  5. [三國志30] 陳壽 作(西晉時代), 裴松之 註 (南朝劉宋時代). 三國志/卷30

  6. [相田2009] 相田満 (2009). 地名オントロジ - 大日本地名辞書からの出発, 研究報告人文科学とコンピュータ(CH)Vol. 2009-CH-83, No. 2, p. 1 - 8,  発行年 2009-07-18  http://id.nii.ac.jp/1001/00062482/

  7. [県主の一覧 - Wikipedia] https://ja.wikipedia.org/wiki/%E7%9C%8C%E4%B8%BB%E3%81%AE%E4%B8%80%E8%A6%A7


この記事が参加している募集

日本史がすき

この記事が気に入ったらサポートをしてみませんか?