本__2_

グーグルレンズで領収書を整理する

領収書の整理は面倒な作業
 領収書の整理も、煩瑣な事務作業です。
 会社勤めの人であれば、交通費、出張費、会議費、交際費などの精算のために精算書を作成し、合計金額を計算する必要があります。
 会社がこの作業を自動化するソフトを導入していてくれればよいのですが、そうでない場合には、自分で計算作業をする必要があります。

 フリーランサーになって税務申告をするようになると、少額のものまで含めて領収書を多数集め、それを費目ごとに分類して合計を算出するという作業が必要になります。この場合に自動処理ソフトを導入するのは、コストの点からみて、普通は無理でしょう。そこでかなりの時間をこの面倒な作業にさかなければならなくなります。

 本来、こうした作業はできるだけ自動化して必要な作業時間を削減し、本来の仕事に集中したいものです。

非定型文書からのデータ抽出機能は十分でない
 グーグルレンズが写真から数字の部分だけを抜き出してくれれば、それをスプレッドシートに貼り付けて、合計などが計算できます。しかし、残念なことに、いまのところ、グーグルレンズにその機能はありません
 下の写真のように、領収書の全体をテキストとして認識し、その中でタクシー会社についての情報を抽出して下に表示してしまいます。ここには、タクシー会社の電話番号と住所があるだけで、金額のデータはありません。一番下に「この検索結果は役に立ちましたか?」とあるのですが、「いいえ」と答えざるをえません。

名刺のデータ化機能は使えるか?」で見たように、名刺からのデータ抽出も完全ではないのですが、領収書の場合には、さらに不完全です。単にテキストとして認識するだけであり、人間が画像を見て指定しないかぎり、それを金額、日付、支払先などのデータとして区別して認識してくれるわけではないのです。
 グーグルレンズの非定型文書からのデータ抽出機能は、まだ満足のいく水準にはなっていないと言わざるをえません。

 データを種類ごとに区分して抜き出す抜き出すのは、それほど容易なことではありません。名刺の場合には、電話番号もメールアドレスも定型的なので抜き出せるのですが、領収書の書式は一定していないので、区別が困難です。それに、数字は文字のように冗長性がないので、誤った数字を認識してもそのチェックができません。電話番号や日付の数字を金額と誤って認識したりすると、重大な問題を引き起こします。

 現在でも領収書などの非定型データを数値化してくれるサービスが提供されていますが、AIを用いて認識しているのではなく、人間のオペレーターが実物を見て判断して入力しているようです。これらのサービスの価格がそれほど安くないのは、このためです。

 ただし、現在でも、グーグルレンズ領収書の整理に使えないわけではありません。下記のような方法をとることによって、これまでの手作業よりも簡単に領収書を処理することができます

ここから先は

1,891字 / 3画像

¥ 100

この記事が気に入ったらサポートをしてみませんか?