【LINE Botで文字起こし】Cloud Vision APIを利用したOCRボットの作成手順を公開

2018年11月14日 11:54

以前にブログの方で紹介した、GoogleのCloud Vision APIを利用した文字起こしボットの作り方を解説していきます。

文字起こしボットとは

LINE上で文字が含まれる画像を送信すると、画像に含まれる文字を返してくれるボットになります。

書籍の文章を引用したり、レシピ本をまとめたり活用の幅は広いです。

実際のボットの動きは以下の画像のようになります。

※本noteでは以下の技術を用いてボットの作成を行います。
・Google Cloud Vision API
・Google Apps Script
・Google Drive API
・LINE Messaging API

※本noteは以下のような方にオススメです。
・LINEボットを自作してみたい方
・GoogleのCloud Vision APIを使用してみたい方
・機械学習の技術に触れてみたい方
・Web APIを用いたアプリケーションの作り方を知りたい方

それでは早速、解説を初めていきます。

上記のブログ記事内でも紹介していますが、文字起こしボットの大まかな処理の流れは以下のようになります。

Messaging API
LINEボット本体です。
Messaging API上からボットの箱を作ります。

Google Apps Script（GAS）
通称GASです。Javascriptを記載するだけで簡単なWebアプリケーションが作成できるGoogleのサービスの1つです。
無料で利用できるにも関わらずこれが使えるだけで結構いろんなことができます。
LINEボットの処理内容自体もGASで処理できます。

※Messaging APIとGoogle Apps Scriptの使い方自体は以下のブログ記事を参考にしてください。

Google Cloud Vision API
Googleが提供しているサービスの一つで手軽に機械学習を利用した画像解析を行うことができます。
今回文字認識に使用する光学式文字認識(OCR)以外にも多くの画像解析機能があります。