見出し画像

データ活用社会創成シンポジウムから

 本日、11時より、18時過ぎまで、東大浅野キャンパスにて、参加してまいりました:

昨年あたりから、ビッグデータよりも、データサイエンス、5Gの方が注目キーワードとなっています。Society5.0や、Industry4.0など、各人がそれぞれの思いを込めて違った定義をするバズワードは置いておいて、何らかの形でAI、機械学習を当然のように絡めてデータオリエンテッドな学問研究と産業応用を推進しようという勢いを感じることができました。

 5Gのエッジサーバーというより、もっと広域、クラウド上の「マッチングサーバー」に様々なAI的な機能を置いて、コンテンツ流通を高めようという動きもあれば(筆者はこれに賛同)、現場にしかない、独自表現で、意味解釈も定まっていないデータの活用に注力したいという動きもあります。自動運転、医療などでは、数百PB (ペタバイト)のデータの蓄積を10年以上にわたって行っているという貴重な活動が紹介されました。

 人文科学、それも、歴史学の分野で、古の人々の書簡などが数億点もあるという話、これらを高解像度画像で永続的なアーカイブにしたり、AIで文字認識させている試みも紹介されました。様々な筆者が筆でしたためた書簡を読みとって正しく意味を汲み取る研究のためには、現状の認識精度95%超ではだめ。99.5%以上の精度をAIが出さないとダメ、というのは考えてみれば当たり前。20字に1字、誤っていては、研究の素材にならないわけでしょう。AIからみたらニッチな分野(失礼!)であるにも関わらず、高精度が要求される辛い分野という印象をAI屋としては受けてしまいます。

  この他、大学間の有線ネットワークが400Gbpsで接続されようとしていて、しかも、全都道府県が100Gbpsで複数ルートでつながっているなど、米国最先端のカリフォルニア州より日本が進んでいる、などは、認識を新たにしました。

 ポスターセッションは少ししか拝見しませんでしたが、ビッグデータとがっぷり4つに組み、なにより質を担保しようとしている真摯な努力に敬意を覚えます。教育を効果的に、テーラーメード的にするためのインフラ、データ取得環境が、いずれは、教師の教育法の改善、自己認識のupdateにも貢献できることまで視野に入れている研究もありました。10年以上の歳月を費やす覚悟、大変立派です。

 オープンデータという、ごく一部のデータの世界でさえ、いまひとつ盛り上がりにかける感を受けるのはなぜでしょう。データだけでは、アクションにならず、具体的にどんなサービスを実現してくれるのかイメージしにくいということでしょうか。いずれにせよ、データ関連の研究コミュニティをもっと盛り上げる必要性を痛感します。自身の会社でも、ハッカソン主催などで、微力ながら貢献してまいれたらと思います。

この記事が気に入ったらサポートをしてみませんか?