見出し画像

画像代替テキストと視覚障害、アクセシビリティについての私感

X(以下 Twitter)には代替テキスト(ALT)という機能がある。画像を投稿する際に、「その画像に何が写っているか」を説明するテキストで、視覚障害者などへのアクセスを提供するために、投稿者が自分で記入するものである。

代替テキストの使用例

ということで僕は画像を投稿する際、可能なかぎり代替テキストを入れるようにしている。エゴサしていると偶にそのことを言及される。たいていは褒められる。

作家の柞刈湯葉のツイッターは写真はおろかグラフにまでめちゃくちゃ丁寧にaltを入れてることを知った。いい。何かaltをいれるようになったきっかけとかあるんだろか

エゴサで出たツイート

先日もこのような投稿を見かけた。ということで今回は、僕が執拗に代替テキストを入れている理由を説明しよう、と思ったのだがさて困った。僕はただ標準搭載の機能をその用途どおりに使っているだけなので、きっかけや理由が思いつかないのである。「何って……ただ代替テキストを入れただけだが?」である。

しかし、言われてみると世の中のほとんどの人はこの代替テキストを使わない。たまに使う人がいるなと思ったら、だいたいは著作権表記やクレジットに使っている。となると、僕の思考はなにかしら特殊な部分があるということになる。ちょっと自己分析してみよう。

まず、僕の直接の知り合いに視覚障害者はいない(と思う。公言している人は見当たらない)。つまり、この代替テキストは特定の誰かに向けて書いているわけではないし、書き方が適切なのか僕もよくわかっていない。そういう指摘をされたことがない。

ただ、日本の視覚障害者は31.5万人、つまり人口比で400人に1人いるという。僕のフォロワーは4万人なので100人。インプレッション100万のバズツイートが出れば、うち2500人ほど視覚障害者がいる計算になる。それなら代替テキストくらい書いた方がいいだろう。僕は中学時代にデータキャラを目指して眼鏡をクイクイしていたので、今もそういう考え方をする。

「視覚障害者はSNSを使うのか?」と思った方はこの動画とかこの記事を見ていただきたい。僕自身は Twitter で全盲の方を2人ほどフォローしている。

ただ、統計的な話をするのであれば他にも配慮すべき対象はいくらでもある。たとえば僕は(専門分野や世代などが)一部の人にしか通じないようなネタを頻繁に言うし、いちいち解説を入れようとも思わない。つまり、僕は80億人いる地球人類の中で「視覚障害者」と言われる人々を特別に意識して、画像に代替テキストを入れていることになる。なぜか?

さしあたって思いつくのは職業上の理由(小説家)である。小説というメディアは漫画や映像と違い、視覚情報が最初から封じられている。とくにSFを専門に書いているとこれが大変厄介である。そういう生活をしていると、おのずと視覚を使わずに世界を表現することについて考えることになる。

また『目の見えない人は世界をどう見ているのか』(伊藤亜紗/光文社新書)という本も影響しているように思う。ちなみにこの本に興味を持った理由は、表紙がヨシタケシンスケだったからだ。視覚情報をきっかけに視覚のない世界に誘われたわけだ。

内容で印象に残っているのは太陽の塔の話である。「太陽の塔には顔がいくつあるか」と聞くと、晴眼者(目の見える人)はたいてい2個と答える。ところが模型を使って太陽の塔を知った視覚障害者は、それを3個と認識していることが多いという。

太陽の塔(筆者撮影)

実は、太陽の塔には正面の2個のほかに、背後にもうひとつ顔がある。晴眼者は太陽の塔の「見えている側」を平面的にとらえて答えるが、視覚障害者は「見えていない側」も含めて太陽の塔を立体で認識するのだという。この話を読んで「見えない世界は面白い」と感じた。障害者に対して「面白い」というのは不適切に思われるかもしれないが、その時の印象は「面白い」としか表現しようがない。

太陽の塔の背面(筆者撮影)

これは別に「目が見えないことで、逆に物事の本質が見えるようになる」とかいう話ではない。それよりも「異なる身体的性質が異なる世界認識を導くことがある」という現象が面白い、興味を引かれる、ということである。

つまり僕は「障害があっても同じ人間なんだから仲良くしよう」とかそういうことは全く思っていない。「人間だから」などと言い出したら80億人と仲良くしなければならないが、僕にそれほどの包容力はない。単純に関心を持つ要素があるから関心を持っているのである。


というのがメインの理由だが、代替テキストを載せる理由は他にいくつかある。

  • 通信問題。帯域制限やサーバー側の不具合で画像が表示できない時でも、テキストがあれば何の画像かわかる。

  • 翻訳対応。もしかしたら海外の読者が僕の Twitter を見ているかもしれない。日本語のスクショ画像を機械翻訳するのはひと手間だが、代替テキストに載っていれば楽。

  • 検索性。あとになって「あの画像どこだっけ、たしか昔ツイートしたはずなんだが」となった際に、代替テキストがあったら見つけるのが楽になりそう(現時点で Twitter は代替テキスト検索に対応していない)。

  • 習慣。視覚情報を言語化するのは小説家の本分であるため、日常的にあらゆる画像を言語で説明する癖がある。

  • 書いて失うものがない。もともと僕は手癖でタイピングをしているため、テキストを添えるコストが近似的にゼロである。

とはいったものの、これが本当に役に立つのかよくわかっていない。もしかしたら根本的な勘違いをしていて、僕の作業はまったく何にも貢献していない可能性もあるが、とりあえず僕自身はそういう気分でやっている。プラごみの分別と同じようなものだ。あれ実際どのくらい役に立ってんだろ。

また近年AIの急激な進歩で、画像を説明するテキストがかなりの精度で生成できるようになっている。もう少ししたら投稿者自身がセコセコと代替テキストを書く必要はなくなっているかもしれない。そうなっても「そっか〜、じゃ次は何をすればいいかな」と言えるくらいの態度でいたいと思う。


……ためしに昔バズったツイート(まだ代替テキストを入れてなかった頃)の画像をAIに説明してもらおう。

質問:この画像は何が面白いのか説明してください。

回答:この画像にはコーヒーメーカーが写っており、そのコーヒーメーカーに挿入されているのは通常のコーヒーポットではなく、ピレックスブランドの実験室用ビーカーです。コーヒーメーカーは通常、専用のポットまたはカラフェとセットで使用されますが、ここではビーカーが代わりに使われているのが面白い点です。ビーカーは通常、化学実験で液体を測定するために使用される実験器具であり、キッチンやコーヒーの文脈ではあまり見かけるものではありません。

ChatGPT 4 の回答(強調筆者)

だいたい合ってる。これは助かるなあ。



文章で生計を立てる身ですのでサポートをいただけるとたいへん嬉しいです。メッセージが思いつかない方は好きな食べ物を書いてください。