見出し画像

Seeing AIすげー

どうも今回はMicrosoftのAI認識ソフト「Seeing AI」の紹介です。


Seeing AI

seeing AIとは

Seeing AI is a free app that narrates the world around you. Designed with and for the blind and low vision community, this ongoing research project harnesses the power of AI to open up the visual world. Seeing AI assists with daily tasks from reading, to describing photos, to identifying products, and more. The app continues to evolve as we hear from the community and AI research advances.

公式サイト

Seeing AIは、あなたの周りの世界を語る無料アプリです。視覚障害者や低視力のコミュニティのために設計されたこの進行中の研究プロジェクトは、AIの力を活用して視覚的な世界を開きます。AIを見ることは、読書から写真の説明、製品の識別など、日々のタスクを支援します。コミュニティとAI研究の進歩から聞くと、アプリは進化し続けています。

だそうです。前に「ラストマン」にて主人公が耳にかけていた小型カメラ見たいなやつです。

androidとiOSにそれぞれアプリがありました。

使い道

アプリを起動するとカメラで前方が映されるので、下のバー(赤丸)から機能を選択して撮影します。そうするとAIで画角内の情報を判断して読み上げたりしてくれます。

機能

テキスト

表示されているテキストをリアルタイムで読み上げてくれます。

ドキュメント

リアルタイムではなく、ドキュメントを撮影(自動でもシャッターボタン)してテキストを抽出できます。

左下の再生ボタンで読み上げます。また左下の共有ボタンから画像かテキストで共有できます。右上のペンマークでページの削除や再スキャンができます。ペンマークの左のボタンはページの追加です。

とりあえず家に転がってた古い説明書をスキャンしてみます。

字きったないですね。すいません。

読み取り中の効果音が結構うるさい…

製品

バーコードの読み取りです。

ただ自分の環境ではApple Pencilの白箱とmx keys mini for Mac の製品ボックスの二次元コードをスキャンしようとしましたが、認識されなかったりしてまだ使えないかなぁと言った感じ。もしくは日本環境だからかな?

シーン(プレビュー)

これが冒頭で言った「ラストマン」の話です。

まだプレビュー版ですが撮影した写真の内容を認識して音声で読み上げられます。これが結構楽しくて、マウスを写せばマウスと認識されますし、キーボードはキーボードと言ってくれます。

ただMac mini とかの一般的でない形状のものは認識できないですね。

人(顔)認識

人の顔で認識できるようです。

人チャンネルを使用すると、顔認識により、近くにいるのが誰なのかが伝えられます。「中央付近に1人の顔、距離は4フィート」のような音声ではなく、「中央付近にジョン、距離は4フィート」のように名前が読み上げられます。

アプリ

だそうです。実際にやったことはないですが、人の顔と名前を登録しておけば人を認識できます。ただ自分の顔を登録してみたのですが、あまり精度はよくないと思います。自分の環境かもしれませんが。

通貨

どうやら国を選んで、紙幣(硬貨も?)を読ませると金額(アプリでは価値となっているが)を認識できるようです。

単純に色を認識できます。ただフラッシュを焚かれると問答無用で白になってしまいます。

光量を音のトーンで認識できます。音楽になりそうなならそうな感じです。YouTubeで定規演奏みたいなのしてる人には良さげなツールです。

使用感

全体的な使用感としてはまだ開発途上と言った感じです。機能によってはプレビューとの表記がある場合もあるので、まだ本格リリースと言った感じではないのかも知れませんが、sf見たいな世界観が近くなったなーと言った感じです。

まとめ

Microsoftの画像認識アプリ「Seeing AI」についてでした。sfチックな世界観が近づいてきたなぁと感じたところです。

この記事が参加している募集

AIとやってみた

この記事が気に入ったらサポートをしてみませんか?