見出し画像

語彙そのものの形成のモデル化には障壁がありそうという話

お久しぶりです。
ずっと語彙の形成をモデル化しようと考えており、ある程度までの定式化は思いついたのですが、ここにきてある障壁に遭遇しました。

越えるのがめんどくさそうな壁にぶち当たった

思いついた定式化としては、まず語彙を音の連続だと思って、 j 番目の音にどの音素(IPA記号で表現されるようなもの)がどれだけの割合で含まれるかを示す音素ベクトル|p_j 〉なるものを定義、これの漸化式を考えました。
それぞれの音素ベクトルは演算子(行列) P_j によって採択される音素以外の成分が0に落とされ、演算子 G がそれをその音素の後ろに後続しやすい音素の分布に変換、X_j がその他の制約全般による分布の変化を記述するものとして

|p_(j+1) 〉= X_j G P_j|p_j 〉

という漸化式が立てられます。これに従えばまあうまくいきそうという感覚こそありますが、問題点がいくつかあります。大きく以下の3つです。

(a)漸化式なので|p_1 〉はこちらで用意する必要がある。
(b) P_j でどの音素を選ぶかには制限が付けられない。
(c) X_j の中身の決定は一筋縄ではいかない。

(a)の解決策は「じゃあ好きなものを用意すればいいじゃん」なのですが、正直に言って「本当に何でもいい」というのはシミュレーションにおいてめちゃめちゃ厄介です。多分。シミュレーション畑の人間ではないので異論は認めます。ただ決めてしまえば解決するので、最悪全パターン検証すれば済む話で、音素の種類は絶望するほど多いわけじゃないので、比較的解決しやすい問題と言えます。

(b)について、(a)と同じような議論が行えます。ただここでは、そもそも後続させる(連続して発音する)のが難しい音素をわざわざ選ぶという状況は考えにくいと思えば、例えば「最も後続させやすいものを採択する」というように仮定的に規則を設けることはできます。さらに多様性を許すために「最も後続させやすい5種類の音素の内からランダムに選ぶ」「後続しやすさが一定以上である音素の内からランダムに選ぶ」のような規則も可能でしょう。

ある程度以上の高級料理は値段が変わっても味の変化が分からない、みたいなことがあると思います。「ランダム」というのは、音素採択においても同様のことが発生することを仮定しています。

最も厄介なのが(c)です。「その他制限」として私が思いついたものは「音素のイメージからくるバイアス」「母音の数」「そもそも習得されていない音素がある」の3つで、全て対角演算子で書かれます。後ろの2つは大きな問題ではありませんが、「バイアス」は非常に厄介です。
一例として、破裂音や破擦音といった音は「硬い」印象、鼻音は「柔い」印象があると思います。日本語でいうところの「木」「缶」と「水」「餅」、英語でいうところの「kick」「steel」と「mud」「meat」のような対比です。このように対象物によってある程度採択されやすさにバイアスがかかることは考えられますが、しかし「切る」は英語で「cut」であるのに対し刃物や針は「knife」「needle」と鼻音が用いられるなど、バイアスのみで表現するのは少し困難な気がします。そもそも英語は祖語ではなく借用や多言語との融合を経て出来上がったものである、というのも影響しているでしょうが、どちらにせよバイアスが万能でないことは確かです。

ここで考えなければならないのが、その語彙が登場した時の環境、文化はどうだったのかということです。日本語の方言にも見て取れますが、寒い地域ではあまり口を開けずに発音できるような言葉が多かったりします。これは一つの「環境」の影響です。これは地域を絞ればある程度再現できるでしょう。
一方文化については難しいところがあります。ここでいう文化とは、信仰だとか行事だとか身分制度だとかといった所謂「記録に残りやすい文化」ではなく(もちろんそこも関係してきますが)、寧ろ当時の人間が世界をどのように見ていたか、例えばオオカミをみてどう思ったか、語彙が出来上がる前にオオカミが表れたことを仲間にどう伝えていたのか、といった「記録に残らない文化」のことです。「集団の持つ感性」と考えてもよいでしょう。これは当然記録としてはほとんど残らないと考えられますし、そのくせ語彙形成に非常に強い影響を持ちます。また言語によって語彙の出現順序も当然異なりますから、すでに存在する語彙の影響を受けてバイアスがかかることも大いに予想されます。ここまでくるともはやモデル化は不可能に近いです。

越える手法としての最小作用の原理

複雑かつ多すぎる因子が影響してモデル化が阻まれる例が物理学にあります。所謂「カオス」というやつです。三体問題は解析的に解けない、とはよく言われるものですし、身近なところで言えば二重振り子がこれにあたります。

解析解を得られない場合でも運動を表現することは可能です。それが「解析力学」ではお馴染みの「最小作用の原理」「E-L方程式」というやつです。
最小作用の原理は、厳密性を欠いて簡単に言えば「一番疲れない運動が実現する」ことを要求します。電車に乗る前にお金をおろしたいなら、わざわざ駅とは逆方向の銀行に向かうよりも、駅に行く道の途中にある銀行に寄る、といった感覚です。
そしてその必要条件を記述したのがE-L方程式で、こちらは「少し変化させたときにどんな変化に対しても変化前と疲労度が変わらないような運動が実現する」ことを表します。先ほどの銀行の話で言うなら、道中の銀行に寄るか駅のATMを使うかで歩く距離や所要時間に生じる差はないに等しいですから、まあどちらかが選ばれるでしょう。

E-L方程式の問題点は「その運動が本当に一番楽かどうかは一切保証しない」というところです。専門的な言葉を使えば、E-L方程式が要求するのは作用の1階の微係数が0である(その点で極値である)こと以外に何もないので、そこが最小値であるか、極小値なのか、はたまた極大値、最大値なのかは決まらないのです。そのため、作用がconcaveであって極小値を1つ(すなわち最小値)だけ持つときには正しく最小作用の原理を再現しますが、作用が2つ以上の極値を持つときには極値の数だけ解が得られてしまいます。

しかし最小作用の原理を拡大解釈すれば、寧ろ「そこにあって安定である運動が実現する」とも思えるわけです。エネルギー状態の話の時にはよく言われる話ですが、エネルギーの極小値はエネルギー的に安定(その点において傾きが0で、少しずれても生じる傾きによって元の位置に戻ってくる)で、そこから飛び出さない限り最小エネルギー状態でなくともその状態にとどまるというのと同じ感覚です。

書き忘れましたが、状態はより低エネルギーの状態に移るという原則があります。また上の話が元になっているトピックとして、宇宙は実は最低エネルギー状態ではないのでは?とかいう「偽の真空」というお話もあります。

これを先の話にぶち込むと、一般的なバイアスを採用してモデル化をし、そのモデルに対して「いろんな要素が絡み合うから実際形成される語彙はもう少し絞られるだろうけど、大きく括ればこのモデルで形成され得る語彙群のどれかが形成されるだろう」という注意書きをぶら下げることである程度の解決を見ます。
まあ、障壁を乗り越えたというよりは障壁の先の景色を描いた紙を障壁に貼り付けただけで、そこに障壁があって越えられていないのは変わらないのですが。

新たなアプローチを模索

語彙1つを選んでその出来上がりを見るというのは上記の理由でうまくいきそうにない、けどどうしても言語を物理で殴りたい。ので、少し現実的(?)なところに土俵を移そうと考えています。

言語の出現については、鳴き声から派生したという考えとジェスチャーの音声化であるという考えがあるそうです(https://www.waseda.jp/inst/weekly/academics/2015/04/01/31438/)。私は前者に重きを置いて、単なる「豊富な鳴き声」から「言語」という概念に昇華されるところだったらモデル化できないだろうかと期待しました。この2者の間の行き来は連続的ではありますが、「豊富な鳴き声」という性質と「言語」という性質の間には大きな相違があります。仮に「鳴き声」と「言語」の境界が曖昧なものでなく、我々が勝手に決める余地のない強い境界(例えば水と氷は、両者の行き来は連続的な変化で可能ですが、その振る舞いは大きく異なります)があったなら、それは相転移という現象で説明できるはずです。

相転移を考える利点は、「ばっちり物理の土俵であること」「相転移の議論で使われる熱力学や統計力学はほぼ完成した学問であること」「情報学的側面でも考えられること(複雑ネットワークなど)」が挙げられます。また一般には相転移は「自由エネルギーの微係数に不連続性が表れる」と表現され、三態変化は1次相転移、超伝導転移は2次相転移であることは有名ですが、(少し無理やりですが)仮に不連続性が表れなくても「無限次の相転移」という表現ができないことはない、というところにあります。これは私の都合ですが。

対して難点は、そもそも数値的でない言語というものに対して数値的な「自由エネルギー」「温度」に対応するものを用意しなくてはならないことです。また熱力学第1法則

dU = T dS - P dV(+ µ dN)

に準ずる関係式が立てられなくてはなりません。

手を出しているところ

今の時点で、言語に対して
・語彙数 W
・表現可能な状況総数 S
・語彙の汎用度(語彙数に対してどれだけの状況を表現できるか) C
・話者数 P
・語の頻度対簡素度(出現頻度の高い言語が単純簡素であるか) E
・言語の習得難度 D
なら数値化可能だな、というところまで考えています。またこのうち W, S, C は互いに影響し合って C = S / W のような関係にあることは予想がつくほか、既に表現できている状況が自発的に放棄されはしないだろう、という前提を置くことで熱力学第2法則に似た不等式

dS ≧ 0

を用意できます。今後は S がエントロピーに対応してくれるという期待を持って、上記で定義した各種変数の間に成り立つ関係式であったり従属関係を考えていこうというところです。

この記事が気に入ったらサポートをしてみませんか?