見出し画像

漢字が使いたい - 日本語処理への挑戦

昨日は漢字の日だったらしく「今年の漢字」も発表されたようです。そう日本でパソコンが普及するのには漢字の壁があったのです。

パソコンを実用的な目的で使うのであれば、どうしても漢字が使えるようにしたいです。今となれば漢字を使えるのは何も不思議なことはないと思いますが、8ビットな時代には日本語はカナが使えるだけで、漢字を使うのはほぼ不可能でした。

そもそも漢字にコードが割り当てられたのも最初のJISが制定されたのが1978年ですから、大型機であっても漢字を使うことは殆ど出来ませんでした。データとしてはあくまでカナで、どうしても漢字を必要とするときは、カナ情報を元に和文タイプで打つくらいしかできなかったのです(運転免許証が、そうでしたね)。

そもそも漢字を表現するには最低でも16✕16程度のドットを使わないと識別することができませんが、アルファベットを基本に設計されたコンピュータにおいては8✕8以下(apple][であれば5✕7)のドットしか使えません。コードからドットの集合体に変換するフォントデータもアルファベットであれば大文字、小文字に記号を合わせても96文字程度ですから、1Kバイトもあれば間に合います。16✕16で1000文字のデータを持つとすれば、それだけで32Kくらいにはなるので、メモリ空間が64Kしかない8ビットCPUであれば、すべてのデータをメモリに持つことすら困難です。

実はパソコンで漢字を使いたいという欲求はカナを持たず漢字しか使わない中華圏の方が、より切実な問題でした。そこで最初の漢字へのアプローチは香港からやってきた記憶があります。ABCの例会で香港からハンドキャリーしてきたApple][向けの漢字ROMというのを見せてもらいました。これは1000文字程度の漢字フォントを載せたROMを拡張スロットに挿すもので、コードを指定すると1文字分のフォントデータを読み出すことが出来て、これをハイレゾ画面に展開するソフトが付いていました。これで20文字✕12行の漢字を表示することができるので、何とか使えます。プリンタにもフォントなんて載っていませんから、画面上のデータを使ってプリンタにデータを送って印刷します。大抵のプリンタは10インチ幅でアルファベットで80桁は使えたので、これだと40文字分にはなるので、何とかワープロっぽく使えないことはありません。

これは凄いということになったのですが、今度はデータを表示するのに1文字ずつコードを入力していかなければならないことがネックとなりました。実は無印Appleでカナを入力する方法がなかったので、ローマ字からカナデータ(プリンタにはカナフォントがあったのです)を生成するプログラムを自作して使うようなことはしていたのですが(訓令式であれば簡単に作れます)、漢字に対しても何らかの変換プログラムが欲しくなりました。

この時代の漢字入力は、音読みの最初のローマ字を打つと該当する漢字の一覧が表示されて、そこから使いたい漢字を選ぶという形だったと思います。確かに漢字コードは原則として音読みの五十音順で並んでいます。ですから、あいうえおに対応する最初のコードで索引さえ作ってしまえばなんとかなるわけです。

例の拡張カードのフォントデータは中華フォントだったのですが、これを元にJISを見ながらディスクにデータを並べ直し、足りない一部は自作して使ってみました。この時点ではまだ500種類くらいしか使えませんでした。これをローマ字+数字からバッチ的に変換するプログラムを作って何とか漢字を出せるようにした記憶があります。

同じことは誰しも思っていたようで、Apple][用の漢字ワープロが販売されるようになりました。これもローマ字からの単漢字変換しかできなかったと思うのですが、画面で結果を見ながら使えるので、ちゃんと使えるものに仕上がっていました。でも単漢字で入力するのはやはり大変でした。

Apple II 用ワープロソフト、漢字フォント/漢字ライター/及び”Apple World”のフロッピーディスク3点セットで
https://aucfree.com/items/l563779386

もちろん今に比べればドットの数が圧倒的に少ないので、かなり読みにくいかもしれませんし、使える漢字もぜんぜん足りなくて、必要に応じて自分でドットを編集して外字を作る必要がありました。しかし漢字が使えれば実用的な用途は一気に広がります。既に英語圏ではビジネスのために使われ始めていたパソコンですが、日本でも「漢字さえ扱えれば行けそうだ」というところまでは来たわけです。

ただ漢字コードは最低でも16ビットが必要ですし、フォントデータや変換辞書などで必要なメモリを考えると8ビットCPUには荷が重すぎました。漢字がまともに使えるようになったのはパソコンではなくてワープロという専用の機械でした。

ヘッダ画像は奇跡的に残っていたApple][ワープロソフトでレコードの歌詞を印刷したもの。

この記事が気に入ったらサポートをしてみませんか?