機械の目と人間の目の類似点

「機械の目」というと冷徹かつ忠実に現実の世界を切り取るというニュアンスがある。カメラのイメージセンサなどは誰が作っても、それこそ別の惑星の知的生命体が作っても、僕らが持っているものと同じものになりそうだ。しかし実際にはそうではない。カメラは多くの場合、人間が見るための画像を生成する装置なので、人間の目の構造をかなり忠実に反映している。それについてちょっと見てみよう。

多くの人の目にはRGBの3種類の色に反応する3種類の細胞がある。最近は生きた人間の網膜上の細胞を直接観測することが可能になっている。下がその着色した画像だ(画像はWikipedia)。

カメラの撮影素子のカラーフィルタもRGBだ(画像はWikipedia)。

さて、ここでいくつかの共通点に気づくことができる。まずは、どちらもRGBの3色を認識するという共通点があるのだが、3原色というのは、自然界における3つの特別な色というわけではなく、ただ人間がちょうどこの3種類の光の波長に反応する細胞を持っていたというだけにすぎない。ミツバチなどは紫外線を見ることができるので、人間用のカメラで撮影した画像は奇妙に色味がかかって見えて、実用的なカメラとはいえないはずだ。一方で霊長類以外の哺乳類はほとんど2色視なので、そういう生物にとっては3原色カメラには意味のないセルがたくさん含まれているということになる。つまりRGBイメージセンサは特別に人間の視覚を意識して作られているのだ。

他の共通点として、RGBのセルが同数あるわけではないということがある。網膜の画像を見ればわかるように、人間の場合、青を知覚する細胞はかなり数が少なくて、青の解像度は他の色に比べてかなり低い。そのため画像センサでも青を間引いてそのスペースで他の色を認識したほうが、人間の目に高解像度に見える画像を作り出すことができる。一般に人間は緑の解像度が高いので、普通のイメージセンサではベイヤー配列といって、緑が他の2色の2倍ある配列になっている。

ディスプレイも同じように人間の目に最適化されて設計されている。下の画像はOLEDを使ったiPhone Xのディスプレイの拡大画像だ(画像はBGR)。

見てのように当然3原色で、かつ緑だけ高解像度なのがわかると思う。液晶はRGB同数のものが多いが、OLEDではPenTileと言われるこのような緑が多い配列のディスプレイが多い。

このように画像機器は人間専用に作られているので、人と大きく異なる視覚を持つ生物のために画像処理を行う場合、カメラも画像フォーマットもディスプレイも作り直さなければならない。逆に、たとえば人類が滅びたあと、地球上で別の知的生命体が誕生して、その考古学者が古代の地層から人間のカメラやディスプレイを発掘したら、その当時生きていた人間の網膜がどういう構造だったかをそこから想像することができるだろう。これは結構面白いことだと思う。

37

Rui Ueyama

”food for thought”

何度でも読み返したいnote。思考の散策
コメントを投稿するには、 ログイン または 会員登録 をする必要があります。