見出し画像

【校閲ダヨリ】 vol.30 文字すらかつよく解さず、いはんや機種依存文字をや。



   
   
みなさまおつかれさまです。

今回は、ハイテクノロジー(当人比)な領域の、文字の話をしてみたいと思います。
文字化け」という現象がテーマです。

例:・の例
  ・500
  ・ぎとる
  ・草
  ・ドラゴンクエスト 

(もしかしたら、化けて表示されるかもしれません……)   

話をするといっても、私自身いままで「文字化け」という現象を「うーん、なんか化けてる」と思う程度で、不思議がることも原因を調べることもしてこなかった(これはいけません)テーマであり、調べるという校閲者のアビリティを最大限使用するなかでわかったことを共有させていただくような感じです。
   
さて、本題に入りましょう。


機種依存文字」と聞いて、私はまず「環境依存文字」という似たような言葉を思い浮かべました。
結論からいうと、両者意味するところは同じもののようです。
機種依存文字のほうが早く出現し、環境依存文字はどちらかというと近年いわれるようになった呼び名とされ、ともに造語であるためどちらが正解ということもないのだと考えます。

ちなみに「依存」ということばについて少し申し上げると、これの読み方は「いそん」と濁らないのがルーツとされています。
NHKは長年、「いそん」と発音するようにしているらしかったのですが、平成26年度第1379回放送用語委員会での協議により「いぞん」を優先することにしたようです。(NHK放送文化研究所HP 参照)
これにかんしても、濁る・濁らないでどちらが正解というものはありません
   
本題に入ってすぐ寄り道をしました。元に戻ります。
   
私は、「環境依存文字」のほうに馴染みがありましたが、いろいろ調べていくと「機種依存文字」のほうがイメージしやすいように思えたので、今回はこちらを使用して話を進めていきたいと思います。
  
   
我々一般ユーザーが体験する機種依存文字にまつわる困った現象というのは、先でお話しした「文字化け」が最たるものですが、化けてしまった文字は読みようがないですから、これは伝達に支障を来す由々しきものです。
なぜ、このような事態が生じてしまうのか考えるときに、まず知っておく必要があるのは「文字コード」という存在です。

文字コードには「JIS」「Shift_JIS」「EUC」「Unicode」などといった種類があります。
私はアナログ人間なので、これを見ただけで心がざわつきましたが、皆さんはあまり深く考えなくて大丈夫です(気になった方は深掘りしてみてください)。
文字コードは、画像としての文字をコードと結びつけ、キーボードを叩くことで瞬時に呼び出せるようにするためのツールだとひとまず考えることにします。
   
ここでいったん、文字コードを置いて話を進めます。
   
   
書体にまつわる素朴な疑問のひとつに、「どのくらいの文字数を作ればいいの?」というものがあります。
和文書体の場合は、ひらがな、カタカナ、漢字(この種類が膨大です)、記号などという感じになるんですが、一定の基準がないと作る側は困ってしまいますし、やみくもに作っては、使う側が困ってしまいます。
そこで登場するのが「文字セット」です。
文字セットは、定められた文字の集合体のことで、あらかじめ一定数の字体とコードが紐付けられています。
なので、このセットを基準として書体を作っていけば事足りるということになります。
   
さあ、置いておいた文字コードの概念を思い出してください。
   
文字コードには、先述の文字セットを含めた上で、さらに「空き領域」というものが存在していて、任意の文字を設定することができます
そこに文字セットに含まれなかった記号や漢字を割り当てていくのですが、特に世界的にも決まりがない自由領域ですので、「NEC特殊文字」や「IBM拡張文字」など、メーカー独自で設定していくことになります。
そうすると、たとえばNEC機種を使用してメールを作成するとき、これらの特殊文字を入力してしまうと、NEC以外の端末で開くと文字が化けることになるんです。
   
フォントメーカーの「モリサワ」によると
   

機種依存文字に関連して群を抜いて多かった問題に、Windows環境とMac環境で文字データを交換する場合の問題があります(モリサワ「機種依存文字」)

   
と、出版業界では致命的とも思える事象が発生していたようです。
これが機種(環境)依存文字の中身です。
   
   
   
最後に、現在どうなっているかという話をしておしまいにしたいと思います。
   
モリサワによると、
   

現在のOSはさまざまな文字コードに対応しているので、Unicodeを使用していれば、基本的にはコードの割り当て違いに起因する文字化けは防ぐことができるようになりましたが、不特定多数とのやりとりを行う電子メールなどでは、未だに機種依存文字は使わないのがマナーとされています。

   
とあり、

「大丈夫だとは思うけれど、多くの人が見るウェブサイトの制作や、取引先とのやりとりでは使用しないようにするのと、サイトの文字が化けてしまったら Unicode で読み込んでみる」

というところに着地するのではないだろうかと私は感じました。
校閲者としては、「ウェブで人名・地名の旧字や異体字を確認しようとしてもあまりうまくいかないのはこういうことか……」と妙に腑に落ちた、よいテーマでした。
   
   
今回は、読者さまからの題材提供のもと、記事制作をさせていただきました。
いつもお目通しくださり、ありがとうございます。
   
   
それでは、また次回。


追伸
社内のWebチームの方のお話では、

「WEB制作の場合「環境依存文字なので使用できません」というアラートはほとんどのツールの場合で自動で出ることはなく、問答無用で「?」「〓」などに置き換わっています」

や、

「紙と違い「機種(PC・スマホ・タブレット・ガラケー)×ブラウジングの種類」の分だけ、見え方が異なる」

など、とても興味深いお話をいただくことができました。

「自身が作業している環境では表示されていたとしても、他環境では化けているかもしれないという意識をもって作業することが大切」という言葉が印象に残っております。

みなさまのお役に立つかもしれないと感じたため、追伸として共有させていただきます。



参考
「依存」の読みを[イゾン]に変更」(NHK放送文化研究所ウェブサイト)
機種依存文字」(『フォント用語集』モリサワウェブサイト)
文字コード」(同上)
文字セット」(同上)



#校閲ダヨリ #校閲 #校正 #出版 #雑誌 #本 #書籍 #エディトリアル #日本語 #言語 #言葉 #国語学 #文法 #proofreading #magazine #book #publishing #create #editorial #language #peacs

この記事が気に入ったらサポートをしてみませんか?