見出し画像

東洋人はAIが見ても若く見えるのか


はじめまして、GENE@GVです、geneは遺伝子のgeneです。ハンドルネームの由来はまたいつかお書きします。

2020年1月にGranvalleyのAIコンサルティンググループに加わりまして、今回note初投稿です。この記事では、ディープラーニングを使った画像認識について、特にAIを使った年齢推定について書きたいと思います。

東洋人が若く見える説

海外、特に欧米圏を旅行した際などに若く見られた経験はないでしょうか?「ビールを買おうとしたら『子供には売れない』と言われた」のような欧米で“実際より若く見られた”と言う話を私も身近なところで何度か聞いたことがあります。

先日バスに乗った時も、近くにいたカップルが海外で若く見られたという話で盛り上がっていましたし、日本人や韓国人などの東洋人が西洋人に若く見られるというのは結構“あるある”なんじゃないでしょうか。私自身、海外出張の際に年下と思われるドイツ人に年齢を伝えたら、驚いたような顔をされました。

(ホリが深くて鼻筋の通った日本人もいますし、東洋人顔の西洋人だったりルーツが東洋系の西洋人ももちろんいます。決して人を見た目で判断したり、民族的マイノリティの人を差別したりする意図はありません。)

AIなら東洋人の年齢を当てられるの?

そんな若く見られがちな(と思われる)東洋人ですが、年齢推定を行うAIは東洋人の年齢を正しく判定できるのでしょうか。

今回はそれをネット上で無償提供されている“学習済みモデル”を使って検証したいと思います。学習済みモデルとは、ざっくり言うと、「どの顔の人が何歳か」というデータをAIに与え、ルールや規則を学習させたものです。AIはこれをもとに人物の年齢を推定します。

このようなネット上の学習済みモデルは「そもそも西洋人のデータで学習したものが多いので、東洋人だと精度があまり出ない」という説もネット上で散見されます。しかし、東洋人の年齢推定の精度が低いからといって、東洋人を若く判定してしまうとは限りません。そのため、ネット上の学習済みモデルを使ったとき、東洋人がより若く判定されるのか、ということを検証したいと思います。

人間が「東洋人を実際より若く見積もってしまう傾向がある(仮説)」のだとすると、AIだって東洋人を若く見積もってしまうのではないでしょうか。

というわけで、実際に検証してみましょう。


検証する内容

無償の学習済みモデルがネットに上がっていると書きましたが、あの半導体メーカーのインテルも年齢を推定するための学習済みモデルを公開していますので、今回はその学習済みモデルを使ってみます。

以下のリンクはインテルの学習済みモデルの説明です。さまざまな民族の2万人を対象として学習したそうです。

インテルの学習済みモデルは18歳~75歳の間で年齢を判定しますが、わかりやすくするために判定結果を以下の5グループのうちの一つに振り分けることにします。

[18-24歳] [25-34歳] [35-44歳] [45-54歳] [55-75歳]

画像は私が手作業で集めました。各年齢グループの男女で三枚ずつで計30枚を、西洋人っぽい人と東洋人っぽい人ごとに集めました。全部で60枚です。検証と呼ぶには少ないですが、今回はこれでいきます。

※ちなみに画像に写った人の年齢の“正解”ですが、年齢で検索した検索結果だったり、私の独断だったりするので必ずしも正確ではありません。ですが、年齢推定に関してはAIが人間の予測の精度を超えていないレベルなので、今回はこれで良しとします。いえ、お願いですから良しとさせてください。

結果発表 

集めた画像に処理をかけてみました。結果の画像はこんな感じです。

[正解:18-25歳, 西洋人]*1
画像7

[正解:25-34歳, 東洋人]*2
画像4

[正解:25-34歳, 東洋人]*3
画像2

[正解:35-44歳, 西洋人]*4
e_40_m_1 (2) - コピー

[正解:55-70歳, 東洋人]*5
画像6

[正解:55-70歳, 西洋人]*6
画像3

AIも東洋人を若く判定してしまう

やはり東洋人は西洋人に比べて若く推定されていました。正解よりも若く推定した画像の数は、西洋人の14に対し、東洋人は21で、西洋人の1.5倍でした。逆に年齢を高く予想した数は西洋人で4だったのに対して東洋人は0でした。

また、特徴的だったのは若く間違えたときの誤差が東洋人の場合のほうが大きかったことです。東洋人の画像だと、45-54歳グループの画像を25-34歳グループにしてしまうなど、2グループ以上の誤差の間違いが多くありました。

そこで、1グループ若く間違えると1点、2グループ若く間違えると2点...という具合に点数をつけて、各年代ごとに合計して点数化してみました。すると、西洋人は合計で22点になったのに対し、東洋人は合計で42点と大きな差がつきました。

というわけで、AIも東洋人のことを若く判定してしまうことがわかりました。

詳しい結果に興味のある人のために結果の一覧(混同行列)も載せておきます。混同行列は正解とAIの予測結果を表にしたもので、AIの精度を評価するときによく使われます。

03_混同行列

年齢推定AIの活用法

上の結果を見るとAIでの年齢推定は精度が低いと感じた人もいるかもしれませんが、あくまでもインテルの学習済みモデルをそのまま使った場合の結果です。ビジネスで活用する場合には、別の学習済みモデルを使ったり、自分で学習や再学習を行うことで精度の高い推定ができるようになります。

精度の高いモデルを使えば、小売店の店舗の入口や棚にカメラを設置し、その映像をAIを使って分析すれば、来店した人はどんな属性(性別・年齢)の人が多いのか、どのような属性の人がどの棚を見ているのかといったことがわかります。そうすると店舗の棚割りやポップなどを工夫するなどの施策が可能になります。

「こういうAIを使ったシステムを自分で作ってみたい!」という方はぜひこちらのリンクより弊社までご連絡ください。

※ Intel、インテル、Intel ロゴ、Intel Coreは、米国およびその他の国におけるインテル コーポレーションの商標です。

Credits of photos(all photos in this article are from Unsplash)[*1: by Christopher Campbell, *2:by Xtra, Inc. *3: Shot by Cerqueira *4:by Igor Stepanov *5:by Ton Henry *6:by Ravi Patel]

この記事が気に入ったらサポートをしてみませんか?