Japan IT Week秋レポートvol.3【AI-OCR編】

2023年11月21日 18:58

IT・DX・デジタル分野の技術・ノウハウが集結した「Japan IT Week秋」。
最後にご紹介したいサービスは、当研究会がまさにテーマに掲げている「OCR領域」の企業である。

こじんまりとした控えめなブースながら、ドストライクな技術を展開していたのは、「ficha」。
動画や画像から「文字情報」を認識する「OCR」技術を開発している。

「OCR」とは、「Optical Character Reader（Recognition）」の略で、テキスト画像を文字コードに変換する技術である。
この文字認識技術にAIのディープラーニング機能が加わることで、より精度の高い文字認識が可能となる。

↑こうしたゲームにおけるリザルト画像から、文字情報を抽出する作業を自動化することが、当研究会が目下取り組む課題。
（参照：Google driveのOCR文字抽出機能でお手軽リザルト画像解析）
まさに、「ficha」が開発する技術と同じ方向性なのだ。

まず、特筆すべき「ficha」の技術は、「動画からの文字認識」である。
多くのOCR技術は、静止画から文字抽出を行う。
抽出したい文字の「位置」が決まっているので、その場所を指定すれば割と簡単に文字認識ができるという。（京都大学人工知能研究会KaiRAの副会長談）

しかし、動画の場合いつどの場所に認識したい文字が出てくるかわからない。
認識したい場所を固定できないので、非常に難易度が高い技術となる。

「ficha」では、「ドライブレコーダー」などの動画から、道路看板などの文字を認識する技術を展開。
この技術がカーナビに搭載されれば、将来的に地図の更新工程がAIによって相当簡略化できる可能性がある。

まさに、AI技術によって業務効率化が実現できる、理想的な技術と言えるであろう。

昨今、様々なニュースで世間を驚かせている「ChatGPT」にも、画像認識機能が搭載され「”目”が付いた」と話題になった。
この”AIの目”の開発部分でトップレベルのクオリティを誇るのが、「ficha」。

歩行者や車、信号、縁石、フリースペースまでを検出できる「モビリティ検知認識」や、「顔検知認識」、動画での情報認識技術を活かした「HMI検知認識」（ジェスチャーや姿勢、喫煙などの動作を認識する技術）と、守備範囲がとにかく広い。

ドライブレコーダーなどと連携したりと、我々の日常生活に沿ったニーズをターゲットにしている部分も、評価が高い理由であろう。

会場で公開されていた「動画認識」のムービーを見て、思わず足を止めてしまった。
「まさに研究会が追及しているOCR技術を、実用化にまで持っていけている。」
AIは今はやりのキラーコンテンツではあるが、将来的には「AIを使ってきちんとニーズに沿った実用化」が実現できる企業が生き残っていくと想像する。　

「流行り乗るだけ」では淘汰されてしまう。

自戒の念も込めて、「AIで何ができるのか？」「どんな作業が効率化できるのか」といった、「ディティールの探求」が今後の課題なのかもしれない。
…と、少々焦りながらも帰路についた。

一方で、京都大学人工知能研究会KaiRAという非常に強靭なパートナーを得たことも実感し、彼らの知能と技術にかかれば、eスポーツ領域でのAI活用も当研究会の手で開拓できると期待感も膨らんだ。

引き続き、「AI」という文字に関わるイベントには積極的に足を運ばせていただき、レポートとしてまとめていきたい。

終わり

この記事が気に入ったらサポートをしてみませんか？