見出し画像

農林水産省 データ活用最前線セミナー 第1回イントロダクション:魅せる編(2021年7月30日)

これは何?

農林水産省が進める省内データ活用のための人材育成プログラムの一環で、全3回シリーズでお話するランチタイムセミナーの初回です。同省の方々と自治体職員を含めて130名を超える参加をいただきました(これは農水省オンラインセミナー過去最高値なんだって)。

農林業センサスデータをTableauを用いていろいろ可視化していくこと、その際に必要なデータマネジメントについて実例をお見せするという趣向になっています。いくつかの点は、過去お話したものをベースに一部アップデートした内容も含まれます。

初回である今回は、文字通りのイントロダクションです。

スライド一式は、以下からどうぞ。

本日のお話

2021-07-30_DAY1農林水産省データ活用最前線セミナー (1)_ページ_02

データ活用最前線セミナーということで、イントロダクション:魅せる編というお題をいただきましたので、それでお話をさせていただきます。

ご案内の中にあったのは、京都府での当時の取り組みや現在のCode for Japanでの各種取り組みのうち、先進的なダッシュボードとBIツールの活用事例についてご紹介する。

もう一つは、データを可視化することの重要なポイントである「それによって何を伝えるか」というところについて、事例とか、そこで考えていることなどをご紹介することで、これから皆さんがTableauを使っていくとところでご理解が進むといいかなと思ってお話をするものです。

自己紹介に代えて

2021-07-30_DAY1農林水産省データ活用最前線セミナー (1)_ページ_03

当時担当しました京都府のオープンデータポータルサイト、こちらにTableauをたくさん使っています。サイトを開設したのが、2017年度中でした。今では政府機関もTableauを使っておりますけれども、自治体でTableauを使った最初の方の人だと思っています。その後、今日も参加いただいてる自治体の方々でTableauをお使いいただいてる方もいらっしゃいますけれども、多分自治体でTableauを広めた人じゃないかなという自己認識です。

2021-07-30_DAY1農林水産省データ活用最前線セミナー (1)_ページ_04

また、Kindleでも読めると思いますけれども、Tableauをはじめとする12のデータ可視化ツールをご紹介する本を共著で2019年に出しておりまして、その冒頭にTableauが紹介されています。

これは京都の観光データを使って可視化をしている例をご紹介してるんですけれども、Tableauを触っていくときにどういったことできるかな、どうやって操作したらいいかなということをお示ししたものです。今では、Tableauのオンラインの動画もそうですし、いろんな方がたくさんいいものを書かれていますので、迷うことは少なくなってると思いますが、私の書いたものもご参考になればと思います。

Code for JapanとTableau活用

Code for Japanに移ってからもいくつかやっています。なぜCode for JapanがTableauを使うかっていうと、Tableau Publicは無料で使えるツールとして、幅広く活用が進んできていると思いますが、Code for Japanでは政府機関の出しているデータを可視化するという取り組みを進めています。

押印手続きの見直しダッシュボード

2021-07-30_DAY1農林水産省データ活用最前線セミナー (1)_ページ_05

昨年は押印の見直しがすごく話題になりました。政府の手続きで押印を見直す方針が出ましたけれども、その一覧表が確かエクセルだったと思うんです。ものすごい数のデータで「たくさん見直したな」っていうことはわかるんですが、一体どんな内容なのかが一目でわからないので、Tableauで可視化をしたダッシュボードを作りました。

各府省別の手続き、99.何%見直したっていうことが大きく取り上げられていましたけれども、そもそもの手続きどれだけあったんですかと、ここにあるとおり1万5000件ぐらいだそうですけれども、それがどの府省にどういう根拠に基づいて、あるいは、法令の根拠がないものもあったと思いますけれども、それがいつ制定された手続きが存置されていたのかが、一番私が知りたかったことなので、それを可視化したという事例であります。

マイナンバーカード普及状況ダッシュボード

2021-07-30_DAY1農林水産省データ活用最前線セミナー (1)_ページ_06

また、次は私自身が作ったものではなくて、Code for Japanのメンバーで取り組んだものです。総務省のマイナンバーカードの普及状況を、市町村別あるいは年齢と性別別で交付率の推移が毎月更新されているものを可視化したものです。

これも元々はPDFで公表したいたんですね。それをこちらでダッシュボード化する過程でですね、総務省さんもこういったふうに使ってくれるんだったらということで、様式をちょっと見直していただいて、Excelで出していただけるようになったりとかですね、政府とも連携した形で、こうしたダッシュボードを通じて、いろいろなデータを可視化できるようになってるかなと思います。

といっても、これつい昨日なんですが、「毎月更新されてるはずだけど更新されてない」というTwitterからお問い合わせがあって、見てみたら総務省さんが一部様式を「勝手に」変えていて、それで自動化のプログラムが動かなくなってたみたいなんです。

急に変えるのは、オープンデータ上、仕方ないことなんですが、修正点が特に理由のある変更ではないのでは?と思われるものでした。そうしたことは極力やめていただいて、スムーズにこうした取り組みとデータ連携ができるようにご利用いただければなと思う次第です。

データ可視化のプロセス

可視化を使いこなして、データを仲良くなろう

2021-07-30_DAY1農林水産省データ活用最前線セミナー (1)_ページ_07

詳細は第3回目のときにお話しますが、Tableauを使っているとおそらく感じていただけると思うこととして、綺麗に作るっていうことだけが重要なわけではないということです。データの生成・活用・運用というデータ可視化のプロセスをしっかり使いこなして、データと仲良くなる必要があります。

ともすれば、データは、現状では扱いにくいかも知れません。こうした可視化のツールを上手に使えるようになるということは、もともと持ってるデータの可能性がもっと広がるというのが本来であると思います。Tableauも、それをスムーズにするためのツールであるはずなんですが、入り口のところがなかなか難しいとお感じの方も多いと思います。

それは「できないもん、自分って駄目だな」みたいな話ではなくて、そうしたプロセスがうまく設計されていないのだから、あまり心配する必要はないというのが私の考え方です。

でも逆に言えばですね、最後にもうちょっと出てきますが、こうしたプロセスを組織的にどう設計するかっていうことが、ないとですね、データ可視化のプロセスは始まらない、そうしたあたり今回のセミナーもそうしたことを意図して、戦略的に開催されてると思いますけれども、こうした取り組みは継続的に行うことが重要だろうと思います。

行政のデータを可視化することの意味

2021-07-30_DAY1農林水産省データ活用最前線セミナー (1)_ページ_08

オープンデータによる地域の見える化と課題解決

改めて、行政のデータを可視化することの意味について少しこれまでやったことを含めてご案内しますと、先ほど少しご紹介した、京都府でオープンデータの取り組み始めたときに、私が考えていたのはこちらでまとめたものです。

オープンデータ当時からですね、行政機関は公表しなきゃいけないというふうに「出せばいいんじゃないですか」とか「出せばいいんでしょう」みたいなことをどうしても目標にしがちでした。基本法のオープンデータの条文にもですね、「容易に利用できるよう、インターネット上で措置を講じるものとする」って書かれてると思うんですけれども、この「容易に利用できる」というのがミソだなと思います。

官民データ活用推進基本法(平成二十八年法律第百三号)(抄)
(国及び地方公共団体等が保有する官民データの容易な利用等)
第十一条
 国及び地方公共団体は、自らが保有する官民データについて、個人及び法人の権利利益、国の安全等が害されることのないようにしつつ、国民がインターネットその他の高度情報通信ネットワークを通じて容易に利用できるよう、必要な措置を講ずるものとする。

https://elaws.e-gov.go.jp/document?lawid=428AC1000000103

法令の解説とかを見ると、これは機械判読性のことを言ってるんですけれども、これ普通に読むと、スライドの一番左にあるように、オープンデータとしてとにかく出した、例えばクマの目撃情報、内容としてはクマがどこで、いつ、どんな形で目撃されたかっていうことを、京都府では10年分出しています。そうすると、結構な量のテキストデータになりますよね。この中身を見ようと思っても、人にはなかなか分からない。たくさんあるけど何があるんだろうみたいなことで、「容易に利用できない」わけです。

もちろん機械判読性が高いデータだと思うんですけれども、せっかく出すデータをそれが何を意味してるか多くの人により知っていただく。コンピューターに処理してもらうのも重要なんですが、活用したい人たちにとっても、容易に理解できるという意味で利用できるようなオープンデータである必要があると思いまして、その時知ったのがBIツールでありました。

その際、当時からそうですし、今もそうですけれども、BIツールで可視化したものをウェブ上で埋め込んでインタラクティブに利用者が自分で見たいところを見てグラフを操作できるのが、BIツールの特徴です。そうすると、可視化をしてそれを使うことで、スライド一番右側にあるとおり、データをもとにしていろんな人たちと共有をして、話し合いをする、それによって地域課題を解決していくような取り組みに資するんじゃないかというふうに考えました。

つまりは、オープンデータの公開だけではなくて、それによって地域を見える化して課題解決する人たちを増やしていくと、そういう目的で始めたものであります。

これは多分おそらく今もの考え方と変わってないと思いますし、これだけデータのことが注目されるようになってくると、ますますそうした動きを加速しなきゃいけないんじゃないかなと思いますので、TableauをはじめとするBIツールの役割は非常に重要ではないかなと思う次第です。

可視化の例〜クマの目撃情報〜

例えば作成したものをご紹介すると、京都と言うと、皆さん京都市のような観光都市のことを思い浮かべるかもしれませんが、京都府全域の7割ぐらい
が森林に囲まれているところです。

特に北部はクマの目撃情報を報告いただく仕組みになっていて、そのデータが蓄積されて、10年分をオープンデータとして公開してました。

それを可視化するときには、目撃数を月別に見ると、冬眠前にすごく増えるんだなとか、冬眠している1月から3月ぐらいは当然見当たらないんだなとかが、数字として出てくるのでそれをちょっと遊び心で熊のシルエット画像で棒グラフとして表現するインフォグラフィックにしたりとかですね、右側の地図を目撃地点を地図上に落とす方法は、特段目新しいものではありませんけれども、やはりこれだけの数を、可視化するとすごく受けが良かったものです。

こうしたデータをどうやって加工するかは、本セミナー3回目にも関わることで少し先取りしますと、ずらっと並んだデータが1万行ぐらいあるので、例えばテキストで目撃時の状況がレポートされているので、それを形態素解析をしてWord Cloudにして、文字をクマのシルエット上で表現してみました。

ちなみにこれ「柿の木」が前脚のところに見えると思うんですが、柿の木を狙うっていうのが結構目撃されてるので、数として多くでて目立つ形になっていますね。これはクマの生息状況というか目撃情報として、柿の木のあたりでウロウロしてるような生態がよく見られるっていうことだと思いますが、そういったことが如実に出てきて面白いねというふうに思っていただいているようです。

形態素解析の手順

それをやる方法は、いろんなやり方があると思いますが、私はPythonを使ってます。手順としては、ファイルを開いて中身を確認した上で、形態素解析をします。そして単語単語に変換切り取ってもらって、上位500の集計を出すっていうようなことが比較的シンプルにできるようになっています。

その中にも集計には不要なデータが結構あるので、それをストップワードとして消した上で可視化をすると、先ほどのような絵になるといったようなことです。このあたりはググッてみればいろいろ出てくるので、可視化をするとともに、別の方法もいろいろ試してみることができると思います。

行政のデータの中にもこういう使い道があるんだということをぜひご理解いただければと思ってご紹介した次第です。

他の事例〜Tableau Publicとデータジャーナリズム〜

ということで、行政のデータでもいろいろ面白いものが作れたりするんですけれども、Tableau Publicにもいろんな人たちが、いろんな可視化を載せています。おすすめみたいな形でですね、ご紹介しています。インフォグラフィックに近いようなものもあれば、極めて統計的な感じのグラフを緻密に作るっていうようなものもあって、バリエーションがあります。

https://public.tableau.com/app/discover/viz-of-the-day

裏を返せば、そうしたバリエーションに応じて、表現方法をうまく作ることができるのがBIツールだということも分かると思います。こういったギャラリーを見て、こういうやり方があるんだということを覚えるということも重要ではないかと思います。

もう一つの動きとして注目するのは、データジャーナリズムと言われる分野です。ここではご紹介した日経新聞のものでありますが、他にもNHKとか東洋経済新報社、朝日新聞など様々なメディアが、特にこのコロナ禍以降は、メディアによるビジュアル化がなされています。実際には、そうなる前から、ジャーナリストの中では、こうしたデータ可視化をして、社会状況を明らかにし、社会課題を掘り下げていくということに取り組んでいます。

その中に、行政が政策課題として認識すべきようなことを、いわば先回りして、調査報道の一部としてですね、すでにいろいろビジュアル化しているものもありますので、ぜひこうしたものも参考に、あるいは負けてなるものかと思っていただければ幸いであります。

データストーリーテリング

データを理解する

次の話は、そうした可視化をしたものを通じて、一体何を伝えていくかっていうことも重要です。それを実例を踏まえてやっていく訳ですが、その前にですね、これ最近出た本にわかりやすい例がありましたのでご紹介します。

ここにある数字をちょっと10秒間で見てですね、覚えていただいてもいいでしょうか。

では、この数字の左上から順に数えて31番目の数字って何でしょうか。
わかるわけないですよね。

じゃあ次行きますね。
次の文章も10秒で覚えてください。
スタート。

はい。

では、質問は、私はなぜショッピングをしたのでしょうか。
どうですか、これはなんとなくわかりますよね。

天気のことが頭に残ってる方多いと思うんですけども、ちなみに、この問題うまくできてるなと思うのは、いずれも59文字で構成されているそうです。

こちらの31文字目って言ってた話は、こちらで言うと天気のあたりのことを指してるんですが、こういった文章であれば理解しやすいという、人間はそういう認知特性があるということであります。

確かに、よく可視化の効果として事例で紹介されるのは、例えばこの数字のスライドで、0のところを赤く塗ったとしてですね、0がいくつありますかとすると、おそらくそちらの方が分かりやすいということがあると思います

それと同じようなことで、そういった映像化されたものだとしても、データをストーリーと一緒にして、人はそれをよりよく理解できるということであります。

であると、可視化をすることは、単にグラフ化して分かりやすくしようという先に、その中にデータで伝えたいストーリーが必要じゃないかということであります。

データストーリーテリングの例

茶畑が広がる状況

こちらでご紹介するのは、京都府でかつて開催した地域課題解決のためのアイデアソンの時のインプットトークとして、Tableauを使った京都府南部、お茶の産地なんですが、お茶の現状を可視化したものです。

参加者は地元の方が半分と、地元じゃない人たち半分で構成されたチームでいろいろ議論したんですけれども、そのときにまずスライドでお示ししているように、茶どころと言うけども、こういった地図上で見て、赤く塗り潰したとこが茶畑です。ものすごい面積ですよね。

生産金額の推移

アイデアソンは、現地で行いました。その現地で窓から見ると外には茶畑広がっていまして、それを上から見てもこうなんですよっていう話をした上で、お茶に関する統計データを使って可視化を行いました。

お茶と一口に言ってもお茶の中にも一番茶と二番茶があったり他にもいろいろな種類があります。それをエリアになってる和束町と南山城村で、この25年ぐらいの生産金額の推移を示しています。

緑色のところの「てん茶」が、直近ですと和束町で19億円弱と、すごく伸びてるということが分かります。

あるいは、このグラフを見たときにですね、南山城村の一番茶の生産金額がすごく下がってるんじゃないかと見るか、あるいはてん茶がすごく盛り上がってると見るか、それはやはりいろいろ人によって違うと思いますけれども、他にもいろいろなことが見てとれると思います。

茶園面積と生産金額

一方で二つのエリアだけじゃなくて、府内全体で見たらどうなんだろう、と思いますよね。
上のグラフ、茶園面積で見ていただくと、一番下の緑っぽいやつが和束町の面積です。
つまり京都府内で茶園の面積が一番広いということです。
続いて2番目が南山城村でありまして、上位1、2位のお茶どころだということですが、この二つだけで見るんじゃなくてもう1個上ですね、薄いクリーム色の、これ宇治田原町を示しているんですけれども、このトップ3が他とは状況が違いますよね。では、この3つで見たらどうかということも気になるわけです。

またもう一方ですね、面積だけじゃなくてさっきの生産金額と比べて見たときに、面積はこれ実はややちょっと微増してるんですけども、そんなに変化がない方で、生産金額はやはり結構でこぼこしてるねっていうのがご覧いただけると思います。

もちろんこれは気候変動の問題とかですね、その他の要因、後ほど出てきます作ってるものが変わってくるとその単価が変わってきますので、生産金額は数量×販売単価になりますのでその合計で変動するっていうことが複合的に示されてるわけです。

そのうち面積はそんなに変わらない、ないしはやや微増なんだけれども、それと、連動していないということがお分かりいただけると思います。

変化は何を示しているのか?

そうした状況で3つの町村で、それぞれどういった違いが出てくるのか?と思われますよね。先ほどの和束町と南山城村に、宇治田原町を加えて、あと先ほど生産金額でありましたが、次は種類別の生産割合、同じ茶畑の中で何をどんだけ作ってるかっていう割合に変えた上で、先ほど販売金額は数量×単価って言いましたので、単価で数字も見てみました。

そうすると、作っているものが年々変わっていくっていうことが、折れ線グラフの単価に表れている部分と、棒グラフの割合で作ってる種類の増減ということで表現されてるわけです。

そうすると緑のてん茶の部分が全体的にすごい増えてるということと、それぞれでの単価ですね、宇治田原町が一番高くて、和束町、南山城村となっています。宇治田原町が単価が高いのは、玉露茶とてん茶の割合がほとんどだから単価の高いものがあるからなんですが、和束町と南山城村も同じような伸びを見せるてん茶がある一方で、単価がちょっと違うのはなんでだろうとかですね、そういったことにいろいろ気がつくわけであります。

地元の人も知らないデータの掛け合わせ

そうしたときにオープンデータの可視化で分かることと、日常で見聞きしている情報、皆さんご存知かどうか、某有名コーヒーチェーンの抹茶は、ここで作られてるてん茶を原料にしていると言われています。

ですので、さきほど見ていただいたてん茶の、棒グラフの緑の伸びはこうした抹茶のお菓子などのブームによるものが反映されています。今までは玉露と言われているお茶用に使うものから、加工品用の原料に使うという形で生産が進んでるっていうことが言われています。

そして、この抹茶のドリンクやお菓子などを通じて知った人が、特に外国人が和束町に訪れて、抹茶が生産されている茶畑を楽しむアクティビティに繋がるというような流れが出ています。25年分の生産割合のトレンド変化はそのように見て取れるようなグラフであるわけです。

「そういうことなんです」というような話をすると、地元の人にとってはですね、さきほど面積推移で見ていただいた通り、茶畑そのものはあまり変わらないんですね。植えられてるもそんなに変わらないんです。ただ、その後の加工して何に作ってるかって川下のことは、必ずしも川上であるこの和束町では分からない訳でして、地元の人も「◯◯さんが最近てん茶作って儲けてるらしい」みたいな話があったとしても、実際この大きな世の中の流れと自分たちの身の回りにあるものが連動しているということがなかなか結びつかなかったところです。

そこで、こうしたグラフでお話しながら日常の話と結びついていますね、とお話することで、「なるほど」というふうにお分かりいただいたっていうことがありました。毎回こういったところをしっかり作っていくかどうかはあるんですけれども、これまで申し上げたことは、ごくごく当たり前の統計データを組み合わせただけです。データをいろいろ探して気がついたことを共有する、その組み合わせと、それが何と何が関係してるかっていうことをメンションすることでより多くの発見があるということが、少しお感じいただけたのではないかと思います。

データ探索から仮説構築へ

もう一つは、Tableauを使ってよくやってられるんじゃないかと思ってるのは仮説を考える政策立案のところであります。

Tableauを使って仮説を考える

犯罪発生状況2018年(京都府Tableau Public)

どこの都道府県でも公開している7つの手口に関する犯罪発生状況であります。例えばひったくりとか、あの自動販売機荒らしとかですね。

この可視化を作った経緯は、データを公開したので可視化してみようかなと思っていて、開示していただいた警察本部の方と話をいろいろしていました。データの列がいろいろあるので、何で考えていくのがいいのかなって考えてたら、そのとき担当されてる方がですね「自転車ってどういうときに盗難されると思いますか?無施錠だと思いますよね?それって子どもだけなんですよと、大学生は鍵してても盗られたりするんですよ」と言われてですね、それをデータで確認するとどうなるんだろうと思うのが、きっかけでありました。

属性ごとの盗難状況

Tableauは可視化したものにフィルタつけられますよね。そこで属性ごと、小学生・中学生・高校生・大学生で分けて、左上の円環グラフ、中に自転車盗難件数を入れて、青いのが施錠した状態での盗難、灰色が無施錠としてみました。教えてくれた警察本部の方も、それぞれがどのくらいの割合だということは多分ご存知なかったと思うんですけれども、集計してみると、大きく違うということがすぐ分かりました。

それでここをキーにして考えるということはすごく意味があるんじゃないかなと思って、可視化をしてみたということです。

まとめますと、可視化したのは、施錠したかどうか、盗られた時間、曜日と時間帯です。属性としての小学生、中学校・高校・大学と、それぞれ母数が違うので、厳密な比較はできないと思いますけれども、やはり属性によって盗られ方が違うっていうことの掛け算が見てとれると思います。

これがなぜなのかっていうことを考えるのが仮説を考える第一歩かな思います。これは元々のデータから考えると、盗難の報告があったものなので、小学生から大学生それぞれ生活時間が違ったりしますよね。小学生は日中は平日は普通は小学校に行って自転車を使うとかっていうことを考えにくいので、自転車を使った活動する直前に何かをしようとして盗られたというようなことだと思います。他方、大学生は自転車を使って移動するのが日常のパターンなので、それに伴って盗られる時間が示されています。例えば共通して見られる夜の時間帯だけでないですよね。それは場所との掛け合わせの話でもあります。

現場とデータの知見を組み合わせる

こうした可視化は、今までの既存の政策で十分対応できていないのはなぜか、といったようなことを考えるきっかけになるんじゃないかと思いますし、それを先ほどの警察本部の方はもともとそういう日常のいろんな困り事、おまわりさんいろいろ対応されてますがそういったキャリアを持った人が、よくそういう相談を受けたことあるんだなっていう、現場の感覚がこれまた重要ですよね。その現場と感覚と、私のような、そういったことはしたことない人がどういったことかなあとデータを見てみると分かること、それを組み合わせるきっかけを、データが与えてくれるとった、ウィンウィンの関係にあるんじゃないかなと思います。

業務における意思決定に用いる

こうした話を先にもう少し進んでいくと、今後もっとやっていかなきゃいけないということだと思いますが、業務の意思決定、大きな意思決定もあれば、あの少しずつのちっちゃいことも含めて、ちょっと大きな言葉で使ってますが、意思決定に用いる使い方は確かにあると思います。

RPA活用の場面でのTableau〜日常業務で普通に使う〜

これは府庁時代にやっていたことでありますが、RPAってすごく流行って当たり前の言葉になりましたけれども、これは3年ぐらい前の話であります。まだRPAっていうのがあまり伝わってない頃の話で、その頃は行政でRPAツールの実証がすごく流行っていたのですが、府庁ではRPAツールを使わずにですね、Office365の中にRPAのように使えるツールがあって、それをGoogleスプレッドシートと連携させて、最終的にはTableau Publicに読み込ませることで、可視化するデータを自動生成できる仕組みを作って、それをシステム運用業務フローの中で設計していました。

これ今まではですね、職員が手動で自分のOutlook上で15分おきにメールを送ってチェックしていたことがあったのです。何をしてるかというとメールを送った後に、京都府のネットワーク上でですね、遅延がどうしても発生します。

そういうことがあると非常に問題があるのでそれをちゃんとネットワーク側のヘルスチェックをするということでありますが、それを職員が手動でメールチェックをやってたんです。メールは自動で送られるけれど、メールボックスに返信で入ってきた時間を目視する。つまり、送信時間と、受信時間を見て、大丈夫かなっていうことを確認してたそうなんですけれども、これ端末を立ち上げてること、あるいはその職員がそこにいないと分からない状態でした。

そこで、Tableau Publicでは、連携させたGoogleスプレッドシートから30分おきにデータを自動取得してくれますので、それで可視化の内容としては、色でメールが遅延してるかどうかのチェックをかけるというふうにしました。色が濃いほど遅延しているというものであります。

もちろん何時間とか遅延してると、ネットワークの保守の事業者からお知らせくるんですけれども、現場の仕事でよくあるのは遅延なのかは分からないけれど、「なんか遅い」というものです。そうした「未然の遅延」のようなものを感じた職員から「おかしいんだけど」という問い合わせがよくあることであります。

そうするとですね、こちらではそんな感じじゃないし保守業者からも連絡来てないけど、ユーザーのある各職員の体感値として何かメールがおかしいという問い合わせに対応するときに、何かちょっとおかしいようだっていうことがわかってないと、初動が遅れる可能性があります。

実際そういったことから遅延が分かったこともあったわけで、その反応感度を上げるために事業者の保守体制を見直すとなれば、追加の予算もかかるでしょうし、負荷もかかることです。ですので、身近なもので手早くできる、どうそれを設計するというときにこうした可視化のツールは非常に役に立つということを申し上げたかったものであります。

ワクチンメーター

また、2021年4月から参与をしてます滋賀県日野町では、今ちょうどワクチンの新型コロナウイルスのワクチン接種、今日も午後からやるのでまた現場見に行くんですけれども、その接種状況を毎日公表しています。

これは自治体の中でワクチンメーターそのものは初めてではないんですが、Tableauを使って可視化しているのはおそらくまだ唯一じゃないかなって思います。

これはTableauを使いたかったからじゃなくてですね、毎日、タイムリーに接種状況をお伝えしようというのが大目標であります。

それは町民の皆さんからすると、その時々のニュースとかでですね、全国情報が流れます。今はその感染者数が上がっていて、ワクチンの接種の競争になってるみたいなことを言われているわけでありますが、そうしたときに、自分の住んでるところはどうなってるんだとものすごく知りたいし、役場からすると伝えなきゃいけないことであります。

それは自治体共通の考え方だと思いますが、それを可能にするために他の自治体では結構更新に苦労してるようなさまが見て取れるわけです。タイムリーになってないとかですね、グラフがよく変わってしまってこれ作る人が違うんじゃないかと思われる節があるとかですね、だんだん見にくくなってしまうとか、そうした背景には、もともと情報設計をしっかりした上で、負荷が比較的少ない柔軟な形にすることが必要です。そしてタイムリーに更新できるツールということで、Tableauを用いたということです。

その中で、今公開してるものは3つの要素で成り立っています。
まず、最初に一般接種の状況です。かつてのバージョンでは、高齢者接種から始まっていたので、高齢者だけだったんですが、今は国も県もVRSのデータのデータを開示していますので、それに合わせた数字を表示するようにデータ連携させました。

それに伴い、当初は割と高齢者の接種率そのものが関心の高い情報でしたけども、今やそうではなくて全人口ベースでの接種率にシフトしていますので、それを一番左上、つまり一番優先順位が高いところに表示するようにしました。

それが意味するところは、すなわち集団免疫がどれだけ獲得されつつあるのか、それが県内平均と比べてどうかということをきちんとお伝えすることで、日野町の状況は少しビハインドしているんですが、ある意味都合の悪いことかも知れませんけれども、この数字は、町民全体の行動によって作られる数字なので、みんなの努力の跡をきちんと共有するということでもあります。

そして、この状況を、国と県は1日遅れなんですが、日野町は当日分を速やかに開示することにしています。そうしていくと町民さんは、これをご覧になってですね、遅れてるとか、進んできたとかいうことを口コミでお話されてるそうでありますけれども、そうなったら勝ちというかですね、そういった役場からワクチンメータを開示していることを知っていただくだけで、その数字について皆さんの関心を呼んで、じゃあ自分はどうしよう、あるいは家族はどうしようということを感じになるわけです。これが数字の持つ大きな力だと思います。

また、制作側の役場からすると、この裏にですね、年代別の接種状況も出てくるので、それを通じて例えば、今若年者の接種率がどうかみたいなことも言われているわけですけれども、本当に言われているような状況なのかという確認をして、それに応じた、先ほどの自転車の盗難状況と同じでありますけれども、属性に応じてどう考えるかといったベースになるのではないかと思います。

2つ目は、集団接種の状況です。当初はこれだけを開示していましたけれども、今はさきほどの理由で優先順位は低くなっています。

一方で報道機関から「今日は何人接種したのですか」と毎週問い合わせると言われています。それをいちいち役場に問い合わせてもらって職員が対応するのではなくて、ものこのダッシュボードに数字を載せたので、そっちを見てくれと、お互いの負担を減らしたところもあります。

最後の3つ目は、ワクチンの供給状況です。ワクチンの接種状況に応じて開示すべきデータは変わってきています。当初は、高齢者の皆さんの分は確保されているので安心してください、ということを伝えるために、対象高齢者の人数での充足率を表現していました。

それ以降は、残念ながら60代から順次接種拡大をする際に、今(※2021年8月上旬時点)は、50代以下の年代の方は一旦中断せざるを得ない供給状況になっています。

棒グラフで御覧いただきますと、2週間に1度ワクチンが配送されてくるのですけれども、赤いグラフであるすでに到着している分の伸びを見ていただくと、1個ずつ降りていくときの階段のステップの刻みがちょっとずつ短くなっていることがご覧いただけると思います。途中で供給量が減らされていたので、予約が一旦停止しているということをご説明する資料としても使っていますし、直近では昨日配送予定が出てきまして、8月23日週はその階段のステップが伸びました。2箱分配送するということで、次の段階で予約再開できるんじゃないかということが、想定できるといったわけであります。

そうした取り組みは、ダッシュボードの中身で違いが出てきているのは、データを整備しながら進めていたので、スモールスタートです。これまでのものはバージョン1、2、3となっていて、今バージョン4に向けて準備をしているところです(※その後、バージョン4になりました)。

裏側で何してるか、ていうのは今日の話からは少し遠い話でありますが、少しだけ説明しますと、無料で使えて、すぐ作れる仕組みを採用しました。

役場が管理していたGoogleのアカウントから、Tableau Publicのアカウントを作成し、基本はGoogleスプレッドシート上にデータを入力してTableauで自動更新する仕組みがベースです。

そこに入れるデータの口として、今は私が作業してますが、職員が手軽に採用できるように、自治体の場合は、ご存知かあれですがLGWAN上で仕事をしているので、インターネットに繋がっていません。Googleフォーム経由、スマホで入力ができる簡単で、手慣れた方法、これは入力間違えを防ぐためでもありますが、フォームにして入力できるようにしています。

その後予約システムも稼働しましたし、VRSのデータも取れるようになったので、それを自動連携するものもありえます。ただ、LGWAN端末からデータを持ち出すのが手続き上も難しいので、そこは無理をせずに、フォーム上で処理をする。画面を見て転記するにしても、エクセルでやらずに、手元のスマホで入力できるようにするといったような、現実的な方法を組み合わせて自動連携の骨格を維持する形にしています。

まとめと次回の予告

最後に、まとめを少しお話します。

やってくるのは「できたらいいな」の終わり

今日一番言いたかったことはここかもしれません。Tableauのセミナーでありますが、広く言えばTableauをはじめとしてデータ活用をするという意味で、この1年でその状況は大きく変わったということであります。

皆さんご存知の通り、2020年の年末から、今年7月にかけてのデータ戦略と呼ばれるものの中に、オープンデータについては、オープンデータ・バイ・デフォルトでやること、行政はデータプラットフォームとして設計から情報公開を一貫して行う存在としてやるんだというふうになりました。

「なんで公開せなあかんねん」みたいな話を、今日冒頭に申し上げてましたけれども、そういった話はもう終わったものであります。

これから、ではどうしていくかということは、各省の方もそうですし、自治体の方の関心も高まっている、EBPMと呼ばれているものの、要は、この言葉は引きずられる必要ないと思いますが、高度な政策検討をしましょうといういうことだと思います。

そのときに可視化ツールはすごく役に立つということです。具体的にはデータのマッシュアップが気軽にできるということ、Tableauもそうですし他のBIツールもそうですが読み込みができるデータがどんどん増えているということで、そうした動きを加速できるとご理解いただければと思います。

とりわけTableauで言うと、今、GISデータの接続をより使いやすくするという方向にアップデートしていますので、そうした動きは、背景には行政に対して言えば、そうしたデータをもっと使いやすくするように、公開すべきというふうな動きと連動しているものです。

ですので、農水省の方々の各業務の中で使ってらっしゃるデータの中にもそうしたデータをたくさんあるでしょうし、自治体の皆さんもGISデータへの関心が高いと思います。それをうまく設計をして、使いやすくする、あるいは、他の部門、例えば建設部門の持っている業務データとどう融合させるかというようなことは、自治体によってもすごく課題になってるかなと思います。

また、「Tableauは簡単に使えます」と言っても、なかなかそうではないという面もやはりあると思います。ただし、そこはこの2、3年でたくさん本や動画、勉強するコミュニティが出ています。学べる環境、学べる素材もたくさんあるので勉強してくださいというだけでは、やや乱暴なので、こうしたセミナーを通じて、いろんな事例を共有したり、悩みどころをお話しし合ったりとかして、仲間作りを進めていくというのはすごく重要なポイントだと思います。その意味で、農水省さんがこういったことを率先されていることはすごく意義深いことです。

農水省さんは、現場をお持ちの官庁でありますし、この分野は自治体との関係でも都道府県、市町村を含めて連携してやるっていうことが元々予定されている政策分野でありますので、そうした各主体のデータがうまく使えるようになって、可視化を通じて議論ができ、政策立案ができるようになるためのこうしたセミナーが実現することは、いいことだなと思っています。私も何かしらお役に立てればと思った次第です。

スライドに書いている言葉、今申し上げたような未来は、「できたらいいな」ではなくて、これから自分たちで作らなきゃいけないというフェーズに入っています。以前は、「できたらいいな」とか「今のままではできないな」って言ってたような話がよく聞かれたんですけれども、もう戦略でまとめられて、あと実施するだけだということになってるので、関係者の皆さんは一緒に頑張りましょうということかと思います。

環境省データマネジメントポリシーに注目

はい、そんな中で若干みなさま方にプレッシャーを与えるものとしては、ご存知だと思いますが、環境省さんで、今日お話してるようなことを可能にするためのデータマネジメントポリシーをいち早く中央官庁として初めて3月末に策定されています。

いうことで、農水省さんは当然もう検討されてると思いますので、出てくるのを楽しみにしております。

農林業センサスデータを使い倒してみよう

2回目以降はですね、提供いただいている農林業センサスデータを使い倒してみましょうということで、それぞれ参加の皆さんにも提供されるんだと思いますので、Tableauを使って自分で表現してみましょう。

データを探索してわかることを探す、知りたいことを調べるというようなところまでかもしれません。あるいは分かったことを、さきほどのデータストーリーテリングのように、皆さんにわかりやすい形で共有するということまでできるかもしれません。

事前にこちらで確認したところ、農水省の2015年の農林業センサスに集落単位のデータが置かれてましたので、例えばこういった形で集落ごとのデータを読み込んで集落ごとに区切っていって経営体数の階級で色をつけたようなものでありますが、そうしたものは実は結構大変で少し工夫がいるんですが、作業することはできますのでいろいろやってみましょう。

ちょっと参考まで

ちなみに参考までですが、いただいてるデータは少しクレンジングをしないといけないです。集落ごとのシェイプファイルと連結させるために必要な作業として、その連結させる12桁にするために必要なものだけクレンジングをして結合させます。テーブル化した上で、やれば結構簡単にできると思いますので、やってみてください。

もう一つの方法としては、結合するときはTableau Prep Builderでも、できると思います。私は、いつもよくやる方法として、シェイプファイルを一旦GeoJSONに1回変換させたりします。というのは、シェイプファイルはシフトJISでエンコードされていることが多くて、Tableauにいきなり読み込むと文字化けすることがあります。QGISで一旦読み込んでUTF-8に変換した上で、クレンジングをするといった手順だけど、ポリゴン上にきちんと各種数字がマッシュアップできるというようなことです。

以上の説明でできる方は「そうですよね」っていうことですが、そのあたりは3回目のところで少しお話するような内容かなと思います。いずれにしても、きちんと綺麗にくっつきますというご報告です。

ということで、少し駆け足になってしまいましたけども、1回目イントロダクションとしていろんな事例をお見せしながら、今皆さんがこうしたセミナーに参加している意義についても少しお話をしたさせていただいた次第です。ご清聴ありがとうございました。

この記事が気に入ったらサポートをしてみませんか?