見出し画像

行政オープンデータの歴史に学ぶ、データ公開の制度と実践

※ 本記事は、2016年12月に当社オウンドメディア「データ流通市場の歩き方」に掲載された内容を一部改変の上転載しています。記事内の情報は初出の時点におけるものであり、現在の状況とはそぐわない部分がございますので、ご了承ください。

「うちのデータを公開して、何の意味があるの?」と聞かれたら、政府の事例を紹介してみましょう。

オープンデータ運動は、国際組織や各国政府などが現地の市民と協力する文化・社会運動として、すでに10年以上の歴史を有します。ともすれば「足取りが遅い」「発想が固い」と言われがちですが、その地道な足跡をふり返ると、企業や個人がデータを世間へ広めたいと考えたとき、どんな不安や課題があって、制度や組織をどう工夫すれば上手く行くかを学べる、先行事例の宝庫だと気づかされます。

(清水響子・本誌編集部)

オープンデータとは何か?

「オープンである」とは、どのような状態であるべきか?

データの定義には諸説ありますが、もっとも寛容な考え方を採用するなら、「どんな目的のためでも制約なしに、誰もが自由に利用、再利用、再配布できるのであれば、そのデータは「オープン」であると考えてよい(Data are considered to be “open” if anyone can freely use, re-use and redistribute them, for any purpose, without restrictions.)」と言えるでしょう。 [The World Bank]

もちろん、データの公開状態や形式による格付けもあります。なかでも「5 Starデータモデル」は有名で、下図の通り、利用、再利用、再配布が行いやすい順に5段階の区分を示しています。

図1:5Starデータモデル

「オープンにする」とは、何をすることか?

そのせいか、「(csvやExcelなど)機械判読可能なデータでないと使いづらい!」との声も少なくありません。一方で、オープンデータを支援する国際団体が、「最も大切なこと」の1つとして次のように助言しています。

利用できる、そしてアクセスできる
データ全体を丸ごと使えないといけないし、再作成に必要以上のコストがかかってはいけない。望ましいのは、インターネット経由でダウンロードできるようにすることだ。また、データは使いやすく変更可能な形式で存在しなければならない。

OPEN DATA HANDBOOK」(Open Knowledge International)から

「インターネット経由でダウンロードできるようにすること」は「望ましい」とするところが意外ですね。この理解に立てば、「営利目的も含めた二次利用が可能な利用ルールで公開された、機械判読に適したデータ形式のデータ」 [一般社団法人 オープン&ビッグデータ活用・地方創生推進機構, 2016]ではなくても、個別の開示請求に基づいて提供されるデータだって、「非公開ではない」という意味で「オープンな」データでしょう。さらには、こうした動きをひとつの文化・社会運動であると捉えて、「特定のデータが、一切の著作権、特許などの制御メカニズムの制限なしで、全ての人が望むように利用・再掲載できるような形で入手できるべきであるというアイデア」 [オープンデータ, 日付不明]であるとか、「日々生成・蓄積されるデータを共有資産として有効活用しようという営み」といった説明 [柏崎吉一, 2017]もなされます。
複数の見解が──当初の理念や原理的な理解、一般的な定義、簡易な解釈などと──並存しているのです。これは、「オープンデータ」という語が浅からぬ歴史を持ち、一般に広く知られ、公に語られ始めたことの裏返しです。その歴史を大まかにふり返ってみましょう。

オープンデータ運動の国際史

北西欧から米国へ、そして世界へ

図2オープンデータ化に関する動き(Wikipedia等を参考に筆者が整理)

オープンデータという言葉を各国政府が用い、本格的に取組みを推進し始めたのは2009年のことです。その源流は米国と英国の公的プログラムにあります。2004年にケンブリッジ大学が、各国のオープンデータサイトを集約・公開するOpen Knowledge Internationalを始めました(2016年12月現在で520サイト)。続いて国連が2008年にun.data.orgを、世界銀行は2010年にWorld Bank Open Dataを開設し、各国政府のデータ公開を牽引して来ました。 [Data Portals, 日付不明]

さらにニュージーランドやノルウェーなど北欧各国が政府公式のオープンデータサイトを開設するなど、この動きは2009-2010年にひとつのピークを迎えます。そして2011-2012年には東アジア、南北アメリカ、アフリカ、西欧各国が相次いで参画。この盛り上がりを受け、2013年のG8サミット(主要8カ国首脳会議)では、キャメロン英国首相の主導により「オープンデータ憲章」が採択されました。その頃から日本の取組みも加速します。

まずは国連とその関連組織の施策を詳しく見て行きましょう。企業や自治体が外部にデータを提供するとき、どういった制度や組織を作ればよいのか参考になるからです。

国際連合は何のために、どう計画して来たか

図3 国連・関係機関のオープンデータサイト

ご存知の通り、国際連合は、経済・社会に関する国際協力や安全保障を目標に活動しています。その実現には、企業活動と同じく、適切なデータに基づく現状把握と計画管理が欠かせないのでしょう。すでに国連開発計画「UNDP Projects」では、地域や開発テーマ(Responsive Institutions、Climate Change & Disastar Resilienceなど)の予算出所ごとに、(国連開発計画、EC、国別の政府予算など)各プロジェクトの予算消化状況等を地図で表示できます。 [林雅之, 2013]

2000年9月に国連は、21世紀の国際社会の目標として「国連ミレニアム宣言」を採択しました。また、この宣言を実行する目標として「ミレニアム開発目標(Millennium Development Goals: MDGs)」を策定。国際社会が2015年までに達成すべき8つの目標と21のターゲット、60の指標が設定されました。

そして、15年後。MDGsはさらに、「我々の世界を変革する:持続可能な開発のための2030アジェンダ」(2015年)の採択に伴って、「持続可能な開発目標(Sustainable Development Goals: SDGs)」として対象を拡大。新たに17の目標、169のターゲット、230の指標が設定されました。MDGs・SDGsの開発目標を見ると、国連がどんなテーマを重視し、どういった指標で計画管理を進めているのかよく分かります。

図 4 MDGsとSDGsの開発目標

もっとも、国連が目指すモニタリング体制の確立には、まだまだ時間がかかりそうです。2015年の調査では、「MDGs及びSDGsの指標が算出可能」と答えた国は、最も回答が多かった「G.4 公平な教育機会」関連でも8割程度にとどまります。「G14. 海洋、海洋資源の確保」などは、特にデータが不充分な領域のようです。 [Statical Commission, 2015]

図 5 UNSD第46回検討会資料「加盟国の進捗状況に関する国際アンケート調査結果」から抜粋

日本政府の推進戦略

お手本になる? 行動計画と規約の整備

日本ではどうでしょうか。日本政府が本格的にオープンデータに取り組み始めたのは、2012年のことです。同年IT総合戦略本部が策定した「電子行政オープンデータ戦略」には、積極的な公共データの公開、機械判読可能な形式での公開、営利目的も含めた活用の促進などが盛り込まれました。これを皮切りに、国内の制度・規約の整備が進みます。

2012年7月には総務省の主導で「オープンデータ流通推進コンソーシアム」が設立されます。オープンデータ流通の環境・基盤整備を推進する団体で、交流会・検討会を定期開催するほか、「情報流通連携基盤システム外部仕様書」「オープンデータ利活用ビジネス事例集」「データの公開・利活用に関するツール集」など実務者向けの参考資料を作成・公開しています(2014年に一般社団法人オープン&ビッグデータ活用・地方創生推進機構(VLED)が継承)。また12月10日には、「電子行政オープンデータ実務者会議」の第1回会合(※1)が開催され、同会議主導のもと「政府標準利用規約」(第1.0版)が制定されました(2015年に第2.0版を公表)。行政が公開する情報の権利規定を整理した規約で、「原則として著作権フリーであること」が明示された画期的なものです。
(※1)2013年3月27日までは企画委員会の下に置かれていた。

こうした地ならしを踏まえて、2013年6月24日に閣議決定された「世界最先端IT国家創造宣言」(以下、「宣言」)では、政府が持つデータのオープン化が力強く謳われました。続く10月29日には「日本のオープンデータ憲章アクションプラン」 [各府省情報化統括責任者(CIO)連絡会議決定, 2013]が決定。政府による大方針が示されたことで、自治体でもデータカタログサイトの開設などが進みます。

さらに、2016年5月20日には、「宣言」の改定と合わせ、「【オープンデータ2.0】官民一体となったデータ流通の促進」を発表。また、12月15日に開催された「未来投資会議構造改革徹底推進会合」の配布資料「第4次産業革命(Society5.0)・イノベーション」には、2020年までを「オープンデータ集中取組期間」と定め、「IT戦略本部及び官民データ活用戦略会議の開催を行う」と明記されます。 [内閣官房情報通信技術総合戦略室, 2016] 他にも、2017年度には「地域未来投資促進法(現:企業立地投資法)」の改正が見込まれています。この法律に則って、将来には、今よりも多くのデータが請求・開示されることになるでしょう。

どんなデータが、どこで手に入るのか?

日本政府のオープンデータを概観すると?

それでは、実際にどのようなデータが公開されているでしょうか。趨勢を知るために、日本政府が「DATA.GO.JP」で公開するデータについて、種類と形式の統計を取ってみました。

データの種類

分類別に見てみると、「行財政」が最多の29%(図6)。続く「司法・安全・環境」「運輸・観光」「国土・気象」「教育・文化・スポーツ」がそれぞれ9-11%で、これらで全体の過半数を占めます。さらに、登録されたデータセット全体の名称をテキスト分析してみると、国民生活に関する統計、学校教育や科学調査のデータ、政治活動の予算・公示などのデータが収録されていることが窺えます(図7)。

図 6 DATA.GO.JPで公開されているデータセットの種類の分布
図 7 DATA.GO.JPのデータセット名に含まれるキーワード

ファイル形式

ファイル形式の推移も見てみましょう(※2)。2013年には15,000件弱だったデータセット数が、2015年には20,000件以上公開されて、累計51,552件に至っています。年々、オープン化が進んでいるとわかります。
(※2)内閣官房「IT DASHBOARD」http://www.itdashboard.go.jp/ 政府のオープンデータより、2016年12月に取得したデータに基づく。

図 8 OPEN DATAに登録されたデータセットの件数
図 9 DATA.GO.JPに登録されたデータセットの割合

よく指摘されるように、その内訳のうち、約40%がPDFです。調査報告書が多数掲載され、「文献」として貴重ですが、加工や集計には使いづらいですね。

次いで多いのはHTMLです(約30%)。「HTMLでいいの?」とお思いかもしれませんが、スクレイピングツールを使えば、PDFに比べてデータを取得・加工しやすいのです。Chrome拡張機能のScraperimport.ioなど、無料ツールも使えます [わいひら(yhira), 2016](分類は「HTML」なのに、リンク先がPDF文書の一覧ページだったりすることもありますが……)。

機械判読を阻む壁は?

機械判読性で劣るPDFやHTMLの比率が高いのはなぜでしょう。オープンデータに限りませんが、「改ざん防止」「印章が必要」「形式の統一」といった行政文書に特有の制約に加え、二次利用を前提に集計データを加工する作業負荷もあって、公共サイトでは従来、どうしてもPDFの比重が高くなりがちなのです。(※3)
(※3)中央省庁の公式サイトで公開されている情報の形式がHTML1ファイルに対してPDF2ファイルという調査結果もある。

日本語独特の「記法」も課題です。日本語は膠着語に分類され、英語のように単語と単語の間に空白を置きません。「東京都」と「京都」の違いを機械に判読させるには工夫が必要でした。公文書の「作成法」も、テキストデータの扱いを難しくする一因です。印刷時の見た目を優先して、「総 務 大 臣」などと一字空けした書き方をすると、その単語は「総務大臣」だと認識されません。悲しいかな、データ活用の推進を目指す法案でさえ、ベタ打ちの文書を公開するのがやっと。

図 10 構造化されていない文書の例:官民データ活用推進基本法案

集計しやすいデータは増えていないの?

それでも、編集や集計のしやすいデータも今では相当数が公開されるようになりました。5 Starモデルの★★~★★★★★に相当します。図8・9の通り、「Data.go.jp」でもExcelやcsvの割合が約25%まで増えています(2015年の前年比。件数では約1,000件増)。

また、「e-Stat」(開発:総務省統計局, 運営:独立行政法人統計センター)では、約600種類ある政府統計のうち、550の集計表(約120万表、Excelまたはcsv)と67の統計(約8万データセット、XML、基幹統計52統計を含む)を提供。XLS、XLSXでのデータ提供(2008年から)、XML及びjson形式の対応(2014年。APIも開放)、LODに対応した「統計LOD」(2016年。国勢調査や経済センサスなど7種類を対象)など着々と施策が進み、全体のダウンロード数は今や年間約5,000万件に達しました。 [独立行政法人統計センター, 2016]

もっと詳しいデータは提供されないの?

「もっと詳しいデータはないの?」といった要望にも応えて、各省庁が分析用データの提供も始めています。

厚生労働省は「医薬品副作用データベース」(2010年から)、「レセプト情報・特定健診等情報データベース」(2011年から)、「国民生活基礎調査」の匿名データを提供します。総務省は、国勢調査、住宅・土地統計調査、全国消費実態調査、労働力調査、就業構造基本調査、社会生活基本調査の6つを提供。傘下の統計センターが要望に沿ったデータを作ってくれる「オーダーメード集計」(2006年)に加えて、より個票に近い「匿名データ」(2012年)の提供も行います。どちらもデータの利用目的は「学術研究の発展や、高等教育の発展に資すること」に限られ、事前審査もありますが、数万円・1ヶ月ほどで高品質のデータが購入できます。

地域のデータはどこで入手できる?

図11 地域資源データ共有サイト CityData

図11 地域資源データ共有サイト CityData

自治体もオープンデータを提供しています。やり方は様々ですが(公式ホームページ、独自のカタログサイト、地域共有サイト、一般社団法人リンクデータのような半官半民団体など)、概況を知りたい方は、地域資源データ共有サイト「CityData.jp」(Linkdata.org)が便利です。データセット数とアイデア数を評価指標とした自治体ランキングを公開しています。

長野県須坂市、神奈川県横浜市、福井県鯖江市などが上位に名を連ねます(2016年12月現在)。最上位の須坂市の公式サイト「いきいきすざか」を見てみると、「Linkdata.org」でデータ公開するだけでなく、市民からオープンデータの提案を受け付けていて、名古屋大学大学院の遠藤守教授、兼松篤子研究員らが精力的にデータを作成・公開しています。

オープンデータの作り方 ――現場の悩みと解決策

まずは、手順を知ることから

それでは、自組織でオープンデータを作るにはどうすればいいのでしょうか。作業手順は「5つ星オープンデータソン作業手順」などにまとまっていますので、ここでは日本と米国の「考え方の違い」を比べてみましょう。参照するのは「オープンデータをはじめよう」 [内閣官房 情報通信技術(IT)総合戦略室]と「Data Lifecycle Recommendations」(The 2016 U.S. Open Data Roundtable)です。

図 12 オープンデータ作成手順の日米比較

日本の資料は真っ先に「担当チームを決めよう」を挙げるなど、組織のルール・意識づくりに焦点を当てます。「地方自治体における情報システム基盤の現状と方向性の調査」 [独立行政法人情報処理推進機構, 2016]で、自治体が「推進体制が決まっていない」(66.1%)「職員のスキル、ノウハウが不足している」(66.3%)を最上位の課題だと回答していることと符号していますね。

対して米国の資料では、データ品質向上を推奨するほか(Standarization, Managing Privacy)、組織外から協力を得ながら進める姿勢が垣間見えます(Communities and Collaboration)。そして、どちらも改善(Improvement)を重視しています。たしかに、一度データを公開したら終わりではなく、利用者の声を集めたり、データの利用状況をモニタリングすることは重要です。

「投資対効果は?」と聞かれたら

とはいえ、自治体ごとにも温度差があります。内閣官房や総務省が熱心に成功事例を紹介したり [内閣官房, 2016] [総務省, 2015]、2017年2月にはIT総合戦略室が自治体向け標準フォーマット例を公開したり [電子行政オープンデータ実務者会議, 2017]しているのですが、「地方自治体における情報システム基盤の現状と方向性の調査 [独立行政法人情報処理推進機構, 2016]」では、「未検討」が45.2%。「効果が実感できない」との声が毎年寄せられます。市場規模1.0~1.2兆円、直接効果1.5兆円、経済波及効果5.4兆円といった推計 [林雅之, オープンデータ・ビジネス(3)オープンデータの経済効果, 2014]はあるものの、はっきりした「効果」を実感できる身近な事例が、まだ多くないからかもしれません。

Gartnerの発表によると、2019年までには、数百万人規模の都市の50%以上の市民が、IoTやソーシャルネットワークを通じて自らのデータ共有に応じ、全ての自治体の20%が、付加価値のあるオープンデータにより収入を獲得すると予測しています。 [Gartner, 2016] 一方で、「Innovation Nippon 研究会報告書 オープンデータの経済効果推計」では、オープデータの経済効果を年間1,800億円~3500億円と試算しつつも、オープンデータの経済効果について「厳密な値ではない」「意味が多義的である」と効果推計の難しさを論じています。

事業メリットは大いにある?

もっと分かりやすいメリットも考えてみましょう。グルメ口コミサイトYelpでは、サンフランシスコ市、ニューヨーク市がオープンにした飲食店の衛生管理データをAPIで取り込み、自社サイトで表示しています。飲食店にとっては宣伝効果や信頼醸成が期待でき、利用者は衛生状態を考慮してお店が選べるようになり、Yelpにとっては掲載情報が充実できます。

この例では、衛生管理データを公開したあとにページ閲覧や予約、口コミ、売上などが増えたお店を見つけて、それ以前のデータと比較すれば、衛生管理データの公開が生み出した経済価値を推計できます(掲載に伴って店舗側のサービスが向上したなど派生要因も含むので、データ公開自体が持つ効果は限定的かもしれませんが)。

ほかには、後述する行政サービスのコスト削減情報資産の可視化といった経済効果が考えられます。

自由と制限の折り合いはどう付ける?

埼玉県の広域オープンデータプロジェクト

日本にも参考になる事例があります。2015年に埼玉県が「県の広報情報をオープンデータとして民間企業へ提供開始!」したとき、利用規約で利用方法や利用条件、申請方法を厳しく制限していたことから、「埼玉県の「オープンデータ」が色んな意味ですごい!」と疑問の声が上がり、公開からわずか2日でWebサイトが閉鎖。政府や市民からも指摘が相次ぎ、毎日新聞にも取り上げられる騒ぎになりました。「オープンの意味が分かっていない」とする立場と、「オープンデータであることよりも、オープンであることの方が重要」 [東富彦, 2015]とする立場で意見も割れました。その後、埼玉県庁では、利用規約から事前申請を必須とする一文を削除。いまではCC-BYでデータを利用でき、「埼玉県の対応の早さには驚いた」と評価されました。

こうした試行錯誤を経て、「Open Data Saitama」では、2017年から埼玉県内の58市町村が参加し、10種類のデータセットを共通フォーマットで提供し始めました。 [埼玉県, 2017] 対象データ選定や共通フォーマット検討のため、当初からデータ保有者である19の市町村に加え、データを利用したい民間企業・組織が参加したワーキンググループを開催(ヤフー、日立公共システム、ソフトバンク・テクノロジー、富士通、りそな銀行などが参加)。利用ニーズの強いデータを数ヶ月に渡って共同検討し、相互運用性の高いIMI共通語彙基盤を取り入れた提供形式で公開(経済産業省、独立行政法人情報処理推進機構(IPA)が協力)。すでに株式会社ミラボが予防接種アプリに施設情報・イベント情報を、一般社団法人オープン・コーポレイツ・ジャパンが「マイ広報紙」にイベント情報を、株式会社ぱどが情報誌「ぱど」にイベント情報を掲載予定です。

意外なハードルの柔らかい乗り越え方

トップダウンとボトムアップの組み合わせで、各方面の利害調整を巧みに実現した事例です。政府の指針に沿って埼玉県庁が音頭を取ることで、県内自治体は首長の同意を得やすくなりました。また、担当職員が原課にデータ公開を求めるとき、共同検討の成果が説得材料になりました。そして、共通語彙基盤を採用したことで、「どんな形式で公開すべきか」との議論も避けられています。

ワーキンググループを取りまとめた企画財政部情報システム課の森田康二朗主査は「自治体では、データをどう出せば良いのかを決めるハードルが意外に高い。ワーキンググループには、行政がデータを出しやすくなるきっかけを作る意味があった」と語っています。 [大豆生田崇志, 2017] このように、制限を覚悟しながら外圧も借りつつ、段階的に鍵を開けていった埼玉県の取り組みは、日本の自治体に案外フィットしているように思います。

コスト削減の効果は?

負担軽減にはつなげやすい

コスト削減の効果はどうでしょうか。例えば、道路改修や除雪といった地域の行政サービスは、予算や人手も限られるなかで、より効率のよい作業が求められます。「FixMyStreet」のように市民の口コミを投稿する場を設けたり、センシングデータを公開したりすることは有益です。

対処が必要な箇所の特定を全て職員が実施した場合のコストと、センサーデータや市民の協力によって場所を特定する場合のコストは比較的簡単に試算できそうです。また、オンラインでデータを公開すれば、遠方の地域にも簡単に情報を届けられます。従来手法の通信費やメディア掲載費が削減できるわけで、こちらも換算対象になりそうです。 [Matsuoka, 2015]

人口1万6400人の町で

北海道森町は、高齢化が進む小さな町ながら、オープンデータ先進自治体として著名。山形巧哉総務課情報管理係長は、オープンデータ推進派として全国から引っ張りだこです。

森町では、Linkdata.orgを活用してサーバー構築・運用のコストを抑えつつ、IMI共通語彙基盤を取り入れたオープンデータを公開。アーバンデータチャレンジ2016でアプリ部門銀賞に輝いた [一般社団法人社会基盤情報流通推進協議会, 2017]小学校の給食献立アプリ「オガルコ」などにデータが利用されています。

「小さな町の小さなリソースだからこそ、オープン化の効果が出やすい」(山形氏)との談は、取組みの意義が大都市だけのものではないことを示唆しています。たしかに、人口の少ない地域の広報は、大都市よりも制作・配達の単価は高くなります。スマートフォンやデータポータルなどの既存インフラを活用すれば、運用コストも抑えられます。

成果が他の自治体に真似されるようになれば、町の知名度が向上し、標準・ひな型として全国に普及する動機づけにもできます。結果として庁内でデータや用語の共通化が進み、文書管理も徹底できたといいます。 [山形巧哉, 2017] [山形巧哉, 人口1万6404人 北海道森町目線でのオープンデータ, 2016]

効果が見えづらい、大変な割に褒められない、予算がない、進め方がわからないなど、データ公開のハードルは枚挙に暇がありません。人材やリソースの不足を逆手にとって、できることから進めていく森町の取組みは、こうしたハードルを超えようとする自治体のヒントになるはずです。 [柏崎吉一, 2017]

どうやって収益化すればいい?

マイ広報紙

効果測定、コスト削減、業務効率化をすべて達成した例を紹介しましょう。一般社団法人オープン・コーポレイツ・ジャパンが運営する「マイ広報紙」は、全国約300の自治体広報紙をデジタル化し、「子育て」「くらし」「講座」などに分類して無料公開しています。従来の主要流通チャネルだった新聞宅配が減少し、市民に情報を届けづらくなった自治体の新たな広報チャネルとして評価されています。2016年からは自治体ごとのスマホアプリも提供し、2017年にはNTTドコモ「iコンシェル」を通じた記事提供も始まりました。 [大豆生田, 2017] 今後は、ニュースサイトや地域フリーペーパーなどへもコンテンツ提供して収益化を目指します。 [一般社団法人オープン・コーポレイツ・ジャパン]

もっとも初めは、外部メディアへのコンテンツ提供に対する自治体の理解は進みませんでした。しかしデータ作成をオープン・コーポレイツ・ジャパンがすべて無償で行うことで、地道に対象を拡大してきました。自治体は、素材提供と権利処理だけで、新しい広報チャネルを無償で利用できます。記事ごとにアクセス数も分かるので、「コンテンツの効果測定ができた」と好評です。

業務効率化は期待できる?

「マイ広報誌」の意外な副産物は、広報担当者の業務負担の改善でした。420紙の約22,000記事が毎月蓄積されるとあって、担当職員が他地域の広報誌を読んで、地元の記事作りに活用していたのです。居住地はもちろん、勤務先や地元、実家の情報をいつでも読めますので、ある自治体では訪日観光客が「マイ広報紙」を見て来訪した例もあったとか。

実は、オープンデータ推進でもっとも効果が大きいのは、公開作業に伴う、情報資産の棚卸しかもしれません。公共機関に限らず、組織内のデータの所在、内容、分量、利用目的、更新者などを一元管理できている団体は多くないのではないでしょうか。ある自治体でも、保育園や幼稚園の情報を公開したいのに、所管部署が分からなかったり、分散していたりして、「誰に頼めばいいのか探すところから始めた」(関係筋)。職員の方々にも「把握していない情報が独り歩きしたらどうしよう」といった「浮遊ファイルのトラウマ」が根強くあると言われます。 [アライド・ブレインズ株式会社, 2013]

自組織にはどのようなデータが、どのような形式で、どれだけ存在するのか。どんな人に使われているのか。これを把握するだけでも、どの部署でどんな業務が行われているか可視化できます。その業務がどこまで必要なのかも再評価できます(BPR:Business Process Re-engineering)。実際に「効果があった」と言及するケースもあります。 [山形巧哉, 人口1万6404人 北海道森町目線でのオープンデータ, 2016]

担当者が忙殺されないためには?

自治体ホームページの教訓

こうした潮流は、21世紀初頭に自治体によるネット広報の黎明期を想起させます。例えば2003年の調査では、広報媒体に「ホームページ」を挙げた自治体はまだ55.9%。 [~自治体「広報」に関するアンケート~, 2003] 原課がMicrosoft Wordで作成した原稿を、IT部門でHTMLやPDFにして公開することが珍しくなかった時代です。DreamweaverやHomepage Builderといったウェブ制作ソフトは高価で難解だったため、「詳しい誰か」に仕事が偏らざるを得ませんでした。

やがて「みんなの公共サイト運用ガイドライン」(総務省, 2005年)の制定も手伝い、自治体ホームページでの情報発信が認知され始めると、Webページ制作の知識がない人でも直接編集でき、サイト全体の体裁・構成を共通テンプレートで管理できるCMS製品が普及します。CMS製品が「HTMLページを作る作業負荷」を減らしたことで、情報の探しやすさやサイト全体の統一感・デザイン、アクセシビリティへの配慮といった「コンテンツ」に注力されるように。ホームページの運用担当部署は、徐々にIT部門から広報部門へ、広報部門から原課へとシフトして行きました。

オープンデータ推進も、よく似た軌跡を辿るのでしょうか。京都市が採用したオープンデータ公開支援ソリューション「DKAN」 [ANNAI株式会社, 2016] や、Google米国が支援する「Frictionless Data」など、職員が手をかけずにオープンデータを公開できる仕組みも提供されています。「データを作る作業負荷」や公開データの管理や効果測定など、ツールの導入で解決できることは、やがて自動化されて行くでしょう。

データの価値は、どう評価するの?

「価値のあるデータ」の候補は公表されている

評価基準の策定も進んでいます。前述した「オープンデータ憲章」は、価値の高いデータを分野ごとに具体的に指定して、G8加盟各国に公開を推奨します。

図 13:G8で合意した公開すべき『価値の高いデータ』
出典:東富彦「G8で合意した公開すべき『価値の高いデータ

Open Data Census」は、Open Knowledge Foundationが2013年から発表している評価で、各国の推進レベルを15分野別に評価しています。日本は、31位(2014年)。Election ResultsやHealth Performanceの分野で赤色が目立ち、2013年の19位から順位を落としました。 [渡辺智暁, 2014]

図 14 Open Data Censusのランキング
出典:Global Open Data Index

活動の進捗評価も指標がある

推進活動そのものの評価では、ワールド・ワイド・ウェブ財団(World Wide Web  Foundation)とOpen Data Instituteが、2013年10月から「Open Data Barometer」を発表しています(図 15 Open Data Barometerの枠組み(ODB-3rdEdition-Indicatorsより作成))。準備(Readiness)、実施(Implementation)、影響(Impact)の3つの枠組みから評価を行っており、3年連続首位の英国は、2015年には全評価項目で100点満点を記録。日本の順位は13位(2015年)で、「実施」は53/100点とやや低いものの、「影響」が前年の30点から65点に改善し、19位から6段階上がりました。「Open Data 500 Global Network」(2014年-, ニューヨーク大学(NYU)のGovlab)では、各国の民間企業500社を対象に、利用しているオープンデータの提供元となった府省を調査しています。

図 15 Open Data Barometerの枠組み(ODB-3rdEdition-Indicatorsより作成)

指標の取り入れ方には要注意

どの評価プログラムも、これから制度設計を行う方の参考になります。とはいえ採点基準や目標が異なることには注意しましょう。順位に一喜一憂せず、自国に適した指標を参考にするのが妥当でしょうか。電子政府実務者会議でも、「1.各指標の評価対象となっているが日本での公開数が少ない分野については、重点的に公開を進める」「2.日本での公開数は多いものの国際指標で評価対象となっていない分野について、評価対象に含めてもらうよう、実施団体へ働きかけ」の2本立てで対策を講じるよう提案しています。 [電子行政オープンデータ実務者会議 , 2015]

図 16 電子政府実務者会議での分析資料
出典:電子行政オープンデータ実務者会議

今後の見通しは、どうなるの?

公的組織のデータ公開が進む

ここまでは主に行政の取り組みを書いてきましたが、今後は企業が持つデータの公開も進むと期待されます。

英国放送協会(BBC)では、2006年から番組データの整備・活用に取り組み、番組内容を記述する用語やデータ構造を定義して、番組関連情報の全てを階層構造化。例えば「BBC Music」では、アーティストごとの出演番組やニュース記事、またバイオグラフィ(Wikipediaから取得)、公式SNSなどを一覧できます。 [宮崎勝、浦川真, 2016] NHKでも、番組情報のLinked Data化を推進します(同文献から)。会員制パーソナル健康情報「マイ健康サービス」や教育機関向けウェブサイト「NHK for School」など、番組データを活用したコンテンツ配信が始まっています。

企業と政府のデータ連携が当たり前に

データとデータを組み合わせる事例もあります。総務省とリクルート、全国100の自治体が集った「都市の魅力向上プロジェクト」では、自治体が持つオープンデータと、個人が実現したい暮らし方のマッチングを目指します。「とことん家族サービス型」「これぞ都会はセレブ型」といったライフスタイル別の指標でお勧めの街情報を知らせてくれ、住民にとってもわかりやすい活用事例といえそうです。 [リクルート, 2016]

産学連携によるデータ融合も活発に

産学連携による実証実験で、「新たにデータを集める」取り組みも増えています。BODIC.orgの実証実験では、九州大学内に設置されたセンサー端末でデータを収集し、食堂や図書館の混雑状況をスマホアプリにリアルタイム配信します。 [高野茂] また、千葉市、市原市、室蘭市、足立区は東京大学と共同で、公用車に取り付けたスマホで道路の損傷を自動撮影、機械学習で対策の優先順位を判断する実証実験を開始。これまで市民の協力で進めてきた「ちばレポ(ちば市民協働レポート)」の次世代版で、「自然と溜まる」データと「意識して貯める」データとの融合が期待できます。 [日本経済新聞, 2017] 写マップあつぎがいらい生物調査隊ちば減災プロジェクトでは、対策が必要な外来種の発生状況や気象・地震被害状況などを市民に投稿してもらい、自治体職員が対策レポートを公開しています。センシングは、降雪量や風速などの気象情報に基づく行政サービスの資源配分、コスト最適化に資するデータとして期待されます。

法整備も

こうした機運を背景に、国内の法整備も進みます。2016年には2つの注目トピックがありました。1つは、企業立地促進法の改正です。産業構造審議会が12月14日に、企業立地促進法を「地域未来投資促進法」に改正し、企業が都道府県などに公共データ開示を要求できるようにする方針を打ち出し、2017年2月28日閣議決定されました。 [経済産業省, 2017]第193回通常国会で法改正が実現すると、都道府県はデータ開示の努力義務を負うことになり、オープン化に弾みがつくと期待されています。 [日本経済新聞, 2016] 鶴保IT政策担当大臣の「IT戦略本部の『官民データ活用戦略推進会議』が司令塔となり、オープンデータを徹底する」との発言にも、強い意気込みが感じられます。 [首相官邸, 2016]

民間投資も活発化する?

もう1つは、官民データ利活用推進法 [官民データ活用推進基本法, 2016]です。起案から公布まで20日というスピード審議で成立しました。同法では、政府機関及び都道府県に、官民データ活用基本計画の策定を義務付け、民間と市区町村にも計画策定を促しています。各地の担当者が草の根で進めてきた取組みが、法的にも後押しされたのです。経済界からの要請も同法の成立を後押ししました(「データ利活用推進のための環境整備を求める~Society 5.0の実現に向けて~」(経団連))。人工知能(AI)、IoT、クラウド・コンピューティング・サービスも、法律として初めて同法のなかで定義されました。 [官民データ活用推進基本法, 2016]

政治の透明性確保へ向けて

もっとも、こうした取り組みはビジネス活用に傾斜していて、政治の「透明性の改善、参加の促進、協働の促進といった観点が抜け落ちている」との指摘もあります。 [西田亮介, 2016] 政府の透明性や資産公開、情報へのアクセスを監査する国際活動が参考になります。「Open Government Partnership」では、国ごとの行動計画(OGP National Action Plan)を策定し、計画に対する達成度を公開しています(2016年時点で75カ国が加盟)。 [Open Government Parntership, 2011]

2016年には「Anti-Corruption Summit」(腐敗対策サミット)が開かれ、参加42カ国が600以上にのぼるコミットメントを提示。同年11月にはさっそく「ANTI-CORRUPTION SUMMIT PLEDGES AND OGP NATIONAL ACTION PLANS: HOW DO THEY STACK UP?」で経過報告を公開。例えばケニアは達成度が7/18個、英国は6/21個、ノルウェーは5/21個を達成しました。他方で行動計画の策定に至らなかった国も、隠すことなく公開されています。 [Tranceparency International, 2016]

公開・活用が期待されるデータは?

それでは今後、どのようなデータが公開されると良いでしょうか。例えば、電子行政オープンデータ実務者会議では、「【オープンデータ2.0】強化分野及びオープンデータの候補例」と題して「①1億総活躍社会の実現関連」「②2020年東京オリンピック・パラリンピック関連」の別に、強化分野とオープンデータの候補合計50例を例示しています。

次はそれらのデータをどう収集し、どう活用するのか、現実的な計画へ落とし込む工夫が求められるでしょう。候補となるデータを誰が持つのか突き止め、提供を交渉し、それを求める人に便利なかたちで提供するには、相当数の利害調整を行わなくてはなりません。

どんなデータが利用できるのか。データの持ち主(オーナー)(縦軸)と集め方(横軸)を軸に整理してみます。

図 17 データの種類(縦軸に公共性の高さ、横軸に進捗とデータの集まり方)

すでに公開・活用されているデータ

  • すでにある基本情報

データオーナー自身の基本情報は、すでに集約・蓄積が進んでいます。政府機関であれば根拠法や施設情報、自治体の条例や組織情報、施設情報、企業の法人ナンバーや会社登記などが該当するでしょう。他のデータを統合するときの「主キー」や「名寄せ軸」に使えますので、公開及び保護ルール、語彙やデータ形式の統一など、基盤整備や使い勝手の改善が急がれる分野です。

  • 自身で作る計画・実績

事業活動を通じて、自身で作るデータも、一部統計化して公開されています。予算・決算や調達情報などが該当します。すでに、上場企業の決算情報は東京証券取引所「TDnet」で誰でも過去5年分を取得できます。他にも、2017年1月19日にリニューアルした経済産業省「法人インフォメーション」を使えば、企業ごとの納税、助成金などのデータをWeb APIを通じて取得できます。日本経済新聞社のように、自然言語処理技術を用いた記事の自動作成に用いる例も現れました。 [井上理, 2017]データ処理の高度化が期待される分野です。

  • 周りから集める統計調査・公開資料

国勢調査や各種統計、企業によるアンケート調査、またその集計データなど、外部調査で集まったデータは、そもそも、何らかの形で(調査結果に基づくサービスやコンテンツなどを含む)、第三者に提供する前提で作られたデータです。権利処理さえ整えば、企業間データ取引でも流通が期待される分野です。これまでにも、自主調査や受託調査を抜粋したり、提供時期を遅らせたり(embargo)して販売する例はありましたが、必ずしも調査会社を経由しない商流も出現するでしょう。

公開・活用が期待されるデータ

  • 自然と溜まる活動履歴

日常の企業活動、行政執務、個人生活のなかで、自然と溜まるデータも活用しやすいでしょう。言わずもがな、センサーやカメラを通じて収集するデータの活用が期待されています。やみくもに収集するのではなく、期待される成果、想定される分析、実現できる施策などをよく吟味して、収集対象と収集方法を見直すことが求められます。

  • 意識して貯める機器ログ・記録

運動量や食事内容、服薬履歴、スマホ位置情報などは、意識して貯めることで価値を持ちうるデータです。もちろんその大半は、メモ書きやSNS投稿、個別の苦情・相談など些細な記録の積み重ねに過ぎません。けれども、私的なメディアに閉じ込められたデータを、データオーナーが自由に移動できるようになれば、別のデータオーナーにとっては思わぬ気づきや見落としが発見できるようになるでしょう。早くも総務省では、有識者会議による提言を受け、「家計調査」に加わる新たな統計として、民間統計やクレジットカード利用、レジの売上、EC利用などを用いた「消費動向指数」を作成する予定だと報じられています。

まとめに代えて――CIVICTECHへの切実な期待

オープンデータ推進活動は、国境を越えた社会活動として、データ活用のアイデアを、データオーナーや組織管理者、研究者やアプリ開発者、コンテンツプロバイダー、一般市民それぞれの視点で、どのデータをどうオープン化し何と組み合わせ、どのように公開すべきなのか、幅広く意見を集め、反映させながら進んでいます。

こうした動きは「CivicTech」とも呼ばれます。日本では、東日本大震災をきっかけに、Code for Japanなどの市民活動が立ち上がり、各地でアイデアソンや事例紹介が行われています。

そのほとんどは法人化もしていないボランタリーな集まりです。活動が盛んな背景には、ソーシャルメディアなどが全国へ普及したことに加え、市民の危機感が潜んでいるのかもしれません。震災からの復興、人口減による行政コストの維持困難、地域コミュニティや都市インフラの衰弱など、市民が自ら行政に参加しないとその地域の暮らしが守れなくなるような、切実な課題があるからです。

毎年3月に開催されるインターナショナル・オープンデータ・デイに合わせて、世界では250以上、日本では60以上の地域で、様々なアイデアソンやハッカソンが行われます。 [Open Knowledge Japan, 2017]他にも年間を通じて様々なシビックテックイベントが開催されており、多くはFacebookイベントやPeatixを活用して広く告知されています。ほとんどのイベントは誰でも参加できますから、ぜひ足を運んで、一度その空気を感じてみてはいかがでしょうか。

参考文献

データカタログサイト(https://docs.google.com/spreadsheets/d/1xw-Cugfs0_aOWfChsBvPoMIw1-C7CTxVAT7TFzq2tqA/edit#gid=0)へ、本記事の参考文献リストを掲載しています。