スクリーンショット_2019-06-14_19

IsiBheqe Sohlamvu-Ditema tsa Dinoko

日本の文字を常用していると案外忘れがちだが、多くの文字は音を形に代えたものだ。何を今更、ひらがな、カタカナは表音文字だろうというのは……まぁ、そうなのだが、厳密に言うとアルファベットのような音のセグメントを表す表音文字と違って連続する音の塊を形にしたものだ。音節文字ともいう。この場合、英語……は、表音文字としてはかなり問題があるんだけど、まぁ、ココをグタグタ始めると長くなるので、そこはともかく、ざっくりそんな感じのセグメントを組み合わせて音を表現する……これを音素文字というのだけれど、これらの文字よりも音節文字は文字数の問題で圧倒的に不利になる……つまり、まぁ、なんというか、必要とする文字の量が多くなるので作業が圧倒的に面倒……って結局そこかよ。

それでもまぁ、日本語のように音韻数が少ない言語の場合はさほど文字数が増えるわけではないので問題ないのだけれど、アフリカの南、そっちあたりの言語だと、ツウ語で子音が58、母音が31……全部の組み合わせが必要になるわけでもないけど、単純にこれを組み合わせ平仮名式にすると1798の違った文字が必要になる。じゃあ、これが最大かというと世界は広いので、これもアフリカだけど、ブッシュマン……え、今そう呼んじゃいけないの? マサルワ? サン? セクシーコマンドーかよ! まぁ、いいや、そのマサルさんとかが使っているコイサン語系の言語に至っては学者によって意見は違うのだけれど、20〜43の母音、130〜164もの子音のセグメントを持つものもあるらしいので、これを上のやり方で計算すると少ない方で2600、多いと7052ものキャラクターが必要になる。アルファベット式でも150〜207文字とかなり厳しい。これらの人々の話す言葉は最古の人類の言語と関連していると考えている学者もいる。まぁ、文字の起源は、事物を簡略化したピクトグラム……つまり絵文字に由来するといわれているんだけど、たしかにこんなに音が多かったなら、音を文字に代えるより絵を描いた方がよっぽど早いって思ったかも。昔の人類は誰も「何百もの記号を作ってそれに音を当てよう」何て発想にはならなかったかもね。

それで、じゃあアルファベットより、もう少し文字数が少なくなるように工夫はできないかというと、まぁ、それも不可能ではない。音節文字から母音などの表記を取り去ってそれらをダイアクリティカルマークに格下げしてしまう方法だ。日本語で言えば「か」と「が」は同じ「か」を共有しているがダイアクリティカルマークにあたる濁点のあるなしで発音が変わる。ルールさえ知っていれば、少ない文字で多くの語を表現できる。アフリカのゲーズ文字やインド系の文字とかがそれだが……まぁそれをすると今度はUnicode化したときにダイアクリティカルマークの有り無しで組み合わせは増えるのでグリフの数だけはたくさん必要になるのだが……たとえば、ゲーズ語の場合基本は30子音7母音なので覚えるのは30文字と7ルールでいいのだが、可能性の全体は210になる。もっとも30子音のうち4音は5母音しか必要としないのでそのぶん差し引けるのだがそれでも202文字になる。もうこうなると面倒だ。ダイアクリティカルマーク必要? 

というわけで、なら、ない方向で、つまり母音を表記しない。まぁ無くてもわかるよな察しろよ的な方法を取った文字もある。その最古の例はフェニキア文字で、世界最古の音素文字と考えられている。この頃になると人類もアフリカにいたときより音韻数が減ってきたので音を文字に置き換えても大丈夫になってきたって感じ? いや、わからないけど。ちなみにこれだと基本20文字でOK。数字、記号、異体字等を含めても30文字ほど作れば言語フルセットの完成だ。どこで使えば良いのかわからないけど……。

で、現存というか、いまある文字でその手の文字が無いのかと言えば、アラビア文字ヘブライ文字がそれに当たる……のだが……両者ともダイアクリティカルマーク?……あ〜、使わなくてもいいけどあった方がわかりやすいよね? まぁ、一応用意はしてあるから……みたいなスタンスなので、フォントを作る場合はその辺りも考慮しないといけない。さらにアラビア文字の場合は字母は28だが、それぞれ頭字、中字、尾字で、まぁ要は単語の頭か中かお尻で字形が変化する。おまけに付けなくても良いはずのダイアクリティカルマークの種類と組み合わせがやたら多い。ある意味ゲーズ文字より厄介だ。こういうの見るとコード化の方法論もあるんだけど、もうUnicode破綻してるよなぁ……とは思ったりもする。こんなのダイアクリティカルマークとグリフに別コード振って、頭字、中字、尾字は字形変化ってことにして、グリフ+ダイアクリティカルマーク+字形っていうのをレガシーなコードに接続すればよかったのでは……Unicodeもなんというか、形が違う物に同じコード振ったり、全く同じ文字を発音違うだけで別コード振ったりと、迷走気味。まぁ、英語も似たように、発音違っても綴り一緒とか、綴り違っても発音一緒とか、そんなのばっかりの文字言語なので、もしかしたら英語話者は矛盾を感じていないのかもしれない……う〜ん、なんか怖い発想になってきたぞ……ただ、まぁ、だけど、世界で三番目に使用者数が多い文字体系にも関わらず記号化がこんなにしっちゃかめっちゃかなのはいかがなものかとも個人的には思うのだけれどもね。

さて、それはともかく、では、もうちょっと楽な文字はないのかというと、やぁ〜世界は広い……のだが、案外近所すら見えていないということはある。チョムスキーとその弟子を間違っているうえに有害と……まぁ、ぶっちゃけ言語学的ナチスト呼ばわりしていた……え? 今でもしてる? まぁ、いいや、その「チョムスキー批判派筆頭」の言語学者ジェフリー・サンプソン(Geoffrey Sampson)教授は、音素文字のレベルよりさらに低レベルにまで簡略化された文字をFeatural writing systemと呼んだ。サンプソンはこの概念をハングルとして知られる朝鮮半島一帯で使わている文字の説明に用いるために発明したとされている。音韻論的には弁別的素性……まぁ、ざっくり文字の話なのに、声が音になって出るときの咽喉鼻腔の状態がどうのという話から始めようか……なんてレベルなので文字分類の発想としては相当変に見えるが、文字を一から作るという発想になったときは別だ……一応日本語では素性文字という訳があてられる。素数文字じゃないよ。まぁ、もうこれ以上細かくできそうにないという意味では、それでもいいのかも知れないけど……。


初代国王李成桂の五男で3代国王太宗こと李芳遠は遊び人の風流人、息子の女にまで手を出すような素行不良の長男にかわって、真面目で利発そうな弟の忠寧を次の国王に指名する。後に世宗大王と呼ばれる李朝中興の祖、4代国王世宗である。まぁ、とはいっても李朝が調子良かったのはもうこの代までで、あとは、もう、このとき作った遺産を食い潰すだけの酷いありさまに成り果てるのだが……って、まぁ、この話はいいか。さて、ハングルはこの王が中国の古い文字(古篆字体?)もしくはパスパ文字(蒙古篆体?)を元にして完成させたらしい……どうも、細かい制作過程がすっ飛ばされているのか、両班の邪魔にあって記録が消滅させられたのかは不明だが、このあたりは曖昧だ。ともあれ、これが発明された経緯はだいたいこんなかんじだ。

身分にこだわらず優秀な人材を登用したともいわれる聡明な王だが、聡明すぎるゆえに多大な悩みを抱えていた。このあたりがろくでなしの兄貴より早死にしてしまう理由なんだろうけど、まぁ、ともかく、その悩みの一つが民衆の識字率問題で、これは当時の朝鮮が漢文だけが標準語で、漢字全部覚えるというのは大変そうだが、さらにはこの読解技術を神聖文字よろしく一部の特権階級が独占していたというのも大きな理由だ。字が読めない連中が増えては、いずれ発展の行き詰まりと階級固定化で社会に悪影響をおよぼすだろうと考えた王は問題解決に奔走する……みたいな話。しかし、相手は悠久の歴史を誇り、しかも5万を超えるグリフ……まぁ、とはいっても同時代で使われていたのは精々5〜6千字程度なのだけれど、それでも眼が眩むほどの作業だ。これをどうやって我が愚民どもに供することができよう。しかも、民に漢字読解技術を開放するなど言語道断と王の命も聞かず妨害とサボタージュに勤しむ両班たち、王の危機意識を理解しない側近、数々の困難を乗り越え……とまぁ、いろいろ、すったもんだあり、遂に世宗25年、大王が自ら朝鮮固有の表記ができる独自の文字を完成させる。世宗曰く漢字の読めない愚民のために28文字の発音記号を作ってやったので、日用に便たらしめむと欲す……偉そうだなあ……あ、偉いのでいいのか……とまぁこんな感じなのだが、これだけで実に大陸の五音三十六字母全部を書き下そうというのだから、非常に冒険的かつ意欲的な試みだ。なんと漢字グリフ全体をたったの28の記号に圧縮できてしまう。世宗の思い立った、その時代最高の音声学的知識をもとに漢字のグリフから表意文字的側面を引き剥がし、表音文字として扱うという大胆な発想がそれを可能にしたともいえる。まぁ言ってみればZIPというよりJPEG圧縮なんだが……え? かえって分かりにくい? まぁ、しかし、折角作った当代最高のテクノロジーも、特権階級の妨害等々で、その後の朝鮮王朝時代では、いろいろとなんだかんだとオーパーツ化していってしまうのだけれど……諸行無常。

まぁ、それはともかく、時代も下って現代では、主に朝鮮語の口語を扱うように用途が変化したので、子音は基本の発音が14、母音は同じく基本発音が10で、これに合成して作った記号を含めて19の子音と21の母音で字母の総数は40となるのだが、もちろん仕組みは15世紀となんら変わらない。これらの字母を子音+母音+終声子音と組み合わせて、これで音節文字を形成する。終声子音は詳しく説明はしないけどパッチムとよばれ、まぁ、「ん」みたいな子音で終わる音。子音もしくは子音とリエゾンする母音の組み合わせで表現し、パターンは27ある。適当に言うと、ひらがな2文字が1文字になっているぐらいのイメージ。もちろん最後の終声子音は必須ではないので子音+母音だけの組み合わせも有りだ。もっと端的に言えば基本的なパーツは24個しか無く、その組み合わせのルールもはっきりしている……と、実に合理的。

しかし、なんだろうね。なんというか、ここまでくると、なんだか、もう圧倒的に読みにくい。人は文字を読むときにいちいち発音の特徴なんかを気にしない。そりゃぁ、作った本人が「賢ければその日の朝に、どんな馬鹿でも10日もあれば理解出来る」と自慢するほど合理的で覚えやすいのはたしかなのだが、その合理性が裏目に出るのかしらないが、並べるとなんかどの字も似たように見えてしまうため結局可読性が犠牲になっている気がする。どうやらオレは世宗大王の予想を超える馬鹿だったようだ。

しかも40覚えときゃなんとかなると言われるその記号も、お察しの通りそれらを組み合わせると膨大な数のグリフが生成される。上の図の右上のスクロールバーの白くなってるところが随分短いなぁ……ってところからも察しはつくとおもうけど、これがどのくらいの数になるかというと、計算はそれぞれの可能性をかけ合わせれば一発だ、19×21×28、答えは11172になる。これがハングル音節文字がUnicodeで結構な面積を占有してしまっている原因でもある。

もちろん機械的に組み合わせると組み合わせた中には一生で全く使われないだろう文字も発生する。具体的には、え〜っと、一万字くらいだったっけ……って、殆どじゃねえか! いや、理屈として可能ならばOKだろうというのはそのとおりで、いつか使うことになるかも知れないからね。というわけで馬鹿でも覚えられるほど簡単なのに馬鹿には覚えられないほどの文字数があるという、いや、まったく、素性文字恐るべしというところなのだが、さらに現代では全く使われることのなくなった古代ハングルのための字母まで使って、順列組み合わせの可能性にチャレンジするともっと恐ろしいことになる。え〜っと、たしか49万字ぐらいだったっけ? また、仮に、さっきのコイサン系の言語にハングル式の文字を設計し、それでグリフを生成すると計算上は100万字を遙かに超えるコードを必要とする。勿論そんな言語があといくつかあれば、あっという間にUnicodeは限界に達する。サンプソン曰く通常の書字体系でハングルと同じ設計のものは存在しないというから、一安心といったところだろうが、通常のといったところにまた、ひどい落とし穴がある。実は崩壊の兆しは迫ってきているとも言えるのだ。


IsiBheqe SohlamvuDitema tsa Dinoko……何て呼ぶんだろう? ことば村や世界の特殊文字ウィキでも出てこない。イシベキ ソランビュ? ディテマツァ ディノコ……では検索できねぇなぁ、日本ではあんまり関心があつまらなかったのかも……まぁ、いいか……文字には見えないかも知れないが、上の図はこれでIsiBheqe Sohlamvu Ditema tsa Dinokoと読める……多分これで合ってるはず。

まぁ、ともかく、この文字は2010年〜15年の間に南アフリカ、ボツワナ、モザンビーク、ジンバブエあたりでつかわれている言葉、バンツー語を表記するために言語学者やデザイナーのグループによって開発された……多分最新の素性文字だ。本人達も「世界で最も鮮明で並外れた書記体系」と言っているが、まぁそう自慢したくなるのも素性文字の発明者にありがちな「あるある」という感じで微笑ましい。……とはいっても、僕の考えた最強みたいな、あまりにも現場とかけ離れたやらかしものをでっち上げたという形にならないように伝統的な芸術のイメージやパターン、記号体系をリスペクトして設計されている……とも書いてあった。まぁ、この文字をもってアフリカ南部の先住民族の書字体系をつくり、アフリカンナショナリズムを鼓舞し、クリエイティビティで世界を圧倒するという野望も……まぁ、あるんだよね? そこは、書いてなかったのでよくわからないけど。開発の動機は頭でもチョロッと書いた音韻の話と関連する「アルファベットでマサルさんの話を書き写そうとするのはかなり無理っぽい」っていう理由からだ。もっとも現在isibheqe.orgのサーバーがダウンしたままなので、そのあたりの状況はよくわからない。アフリカ南部の先住民族に対するネットの普及率もどこまでかはわからないし……それとも文字の布教の過程でドクターリヴィングストン並みの冒険にでも巻き込まれているんだろうか……まぁ、ともあれ、人類の歴史も文字の歴史もそこそこ長いのに「通常の書字体系でハングルと同じ設計のものは存在しない」とサンプソン教授に言われちゃうのは、素性文字の持つ合理性と文字なるものの相性が悪いのかも……文字には……こう、合理主義一辺倒なものの普及を阻む魔力みたいなものがあるのかも知れない。尾形教授の研究室……じゃなかった図書館の書庫で暴れてる黒い獣もハングル食わせれば動かなくなるかも……って、いや、まぁ、ほんと適当……わからないんだけどね……。

さて、しかし、逆に人工的に文字を作りだそうとする人間からすると、素性文字は魅力に溢れたアイデアに見えることもあるようだ。イギリスのティーチャーでオカルテストのベジタリアン、サー・アイザック・ピットマンは世界で最も普及したといわれる速記文字。自称「Stenographic Sound-Hand」ん〜、文字のネーミングにサウンドって付けちゃうところがまぁ、なかなかな感じにもおもうのだけど、え? 厨二病? いやそこまで失礼なことは言いませんよ。まぁ、ともかく、そのピットマンは自称世界最高の速記文字。通称「Pitman shorthand」と呼ばれるこの速記文字を開発する。これもサンプソンにいわせると素性文字だ。さすがにUnicodeもピットマン式をコード化するなんてことは言わないと思うけど……あ、でも、デュプロワエ式はコード化されてるんだ……へぇ〜。符号化して文字にして実装するとなったらいったいどんなフィーチャーが必要になるのか見当もつかない。

じゃあ、ハングル以外にコード化された素性文字がないかというと、実はそれもある。カナダ先住民文字というのがそれで、クリー語やオブジワ語の表記に使用される他、イヌイット語でも一部使われている。イギリスのアマチュア言語学者にして宣教師にして政治家でもあったジェームス・エバンスによる発明だ。まぁ上の図の700を超える文字の山だが……始めは4方向に回転させることでさまざまな母音を再現できる9文字から出発「賢ければその日の朝に、どんな馬鹿でも10日もあれば理解出来る(by世宗)」という素性文字の性質が遺憾なく発揮され、地元のクリー族共同体はすぐにこの新しい書記体系を採用。本人や回りも普及に努力するんだが、まぁインディアン嫌いの白人の邪魔にあったりといろいろトラブルに巻き込まれ、知り合い撃ち殺すはめになった揚げ句イギリスへ逃亡……まぁ、この話もどうでもいいか……また、後にイギリスの宣教師サミュエル・ポラードが、こんどは雲南省東北……北東どっちだったっけ? まぁいいや、そっちのほうに宣教しに行ったときにも猫語……じゃない苗のほう、え、どっちもミャオ? いや、いま、そういうのいいから。それで、その、苗語の方言用にこのジェームス・エバンスのアイデアを参考にして苗文字を作り……まぁ、この文字もコード化されている。が、今では苗語の表記法としてはラテン文字のほうが利用される傾向。まぁ、まったく死語になったわけでもないし、現地5万のキリスト教徒の間では現在も使われているといわれているのだが、この辺詳しくないのでよくわからない……また、現在ではそのポラード文字は若干の改良を経てモン語の文字としても利用されたりもしている。モン語はモン族の言葉でってそのまんまだな……まぁ、そのモン族は総人口で4〜5百万といわれる集団。中老越泰……あのあたりの国境の山岳地帯の住民……まぁ、こう言うと何で経済活動というかメシを食っていたのかは想像つくかもしれないけど、そういうことをいわないのが大人です。お察し下さい。現在は代表なき国家民族機構の一員でもある。と、まぁ、そんなことはともかく、それで、ディテマツァディノコも……まぁ、そういうふうに考えると、この一連の流れの後ろの方に位置するのだとも言えそうじゃない?


さて、いつものコーナー。今回はこのディテマツァディノコをフォントにする。とはいっても肝心のサイトがダウンしたままなので詳細がわからない。ネットに残された残存資料をもとに再現を試みよう。う〜ん、失われた古代文明を復活させようという中二心をくすぐる展開だ。気分はシュリーマンかインディ・ジョーンズ。レイダース・マーチが鳴り響くぜ!

というわけで、謎の地図と、記号表を発見してしまった! これをもとにインディ・ジョーンズしていく話の本題は……今回も長くなってきたので、イシベキソランビュディテマツァディノコの謎と冒険編はまた後日。



この記事が気に入ったらサポートをしてみませんか?