見出し画像

自治体システム標準化の前にまず文字のキホンを理解せよ②


前回の「自治体システム標準化の前にまず文字のキホンを理解せよ①」が思いのほかViewが伸びた。意外だった。なぜ意外か?標準化界隈の村人は、文字に関する食いつきが悪い。その答えは簡単だ、知りたいのは古き良き(悪き)太古の昔の戸籍の文字の話ではない。ここの棒が長い短い。はねがあるない。文字オタクはそっちに走り勝ちだ。誰も興味はない。知りたいのは、標準化における文字要件において、ベンダーがなぜ騒いでいるかが知りたいのだ。
エンジニア目線で言うと、誰も「使わない読めない文字」には興味はない。
が、誰も「使わない読めない文字」を使わざるを得ず、それらの文字には大抵特殊な番号が振られている。
それが厄介なのである。今回はその厄介を紐解く
※繰り返すが、素人に毛が生えた私が素人向けにこれくらい理解しておけば話についてこれるぞ程度のまとめなので、細かい突込みは抜きだ。

①bit(ビット)とbyte(バイト)のキホン

bitもbyteもわからない人は、この記事の読者にはなり得ない。
ただ、ここの理解が重要なので簡単に触れる。

bitとbyte

いわゆるデジタルの最小単位は"原則"bit(ビット)である。
※原則としたのは、量子コンピューターというものがあるからだ。
bitは、0と1(ONとOFF)を扱える。コンピューターの世界は、この組み合わせである。bitを2つ使うと、組み合わせとしては4通りの情報を扱える。理解はこれだけでよい。そして、byte(バイト)だ。bitをりんごに見立てるとわかりやすい。りんごを運ぶときに箱は必要だろう。byteはbitを入れる箱である。しかも、8個入り限定だ。なんとも中途半端な数とも言えるが、えんぴつなどのダースは12だったりする。世の中そんなものなのである。

②Unicodeはアジア圏の漢字を舐めていた!

ここから先は

3,719字 / 8画像

¥ 200

この記事が気に入ったらサポートをしてみませんか?