見出し画像

【デジタル庁】オープンデータの推奨データセットの見直し案について【備忘録】デジ庁のコメントをまとめてみた(アイデア募集期間: 2022年10月12日10時から 2022年10月25日24時まで)

オープンデータの推奨データセットの見直し案(自治体標準データセット)試験公開版について、期待や課題についてお聞かせください。

【趣旨】
推奨データセットとは、オープンデータの公開とその利活用を促進することを目的とし、政府として公開を推奨するデータと、そのデータの作成にあたり準拠すべきルールやフォーマット等を取りまとめたものです。

2017年の取り組み開始より、推奨データセットの更新を順次行い、2022年3月時点では、推奨データセットに該当するオープンデータを公開している自治体数は2022年3月時点で468か所(デジタル庁調べ)と全自治体数の1/4強となっており、その認知や普及は一定程度進んでいます。
他方でアンケート調査結果などから改善が必要な点も浮かび上がってきており、今回「推奨データセット」の名称を「自治体標準データセット」と改め、GIF(政府相互運用性フレームワーク)と連携する形で内容を大幅に改訂・追加した見直し案を策定しました。

【意見の募集内容】
より使いやすいデータフォーマットに改善していくため、今回の見直し案に期待することや課題などについて、例えば以下のような観点からご意見をお寄せください。また、普段どのようにオープンデータを利用または提供されているかも添えて投稿いただけますと幸いです。
・オープンデータ提供者としての視点
・オープンデータ利用者としての視点
・データ項目・形式・構造等について
・その他、公開・活用にあたっての期待や課題
なお、ご意見を頂く際には今回の改訂対象となった下記文書、及びその概要や趣旨についての解説記事を事前にご一読いただけます様お願いします。

(デジタル庁ウェブサイト)自治体標準データセット(試験公開版)
(データチームnote解説記事)推奨データセットから自治体標準データセットへ

https://digital-agency.ideabox.cloud/category/df146eaa-4451-11ed-ae49-0ae94c29cf65

資料は次の通りです。

前回はデジタル庁から「アドレスベースレジストリ担当者さん」がコメントをしていただきましたが、今回は「オープンデータ担当者さん」ですね。

▼オープンデータの推奨データセット(自治体標準データセット)って??

 現在、自治体が持つデータが匿名化などされた状態で提供されていますが、項目やら様式・形式がバラバラです。つまり、各市町村の観光情報をまとめたサイトなどを作るとすると、バラバラな情報を整理して、データベースなどに入れる作業があるのでしょう。かつ、日付なら西暦、和暦など型がバラバラなのだと思います。(裏取りしていないので推測で書いています。)
 乱暴な説明になりますが、それを標準化だ~という話です。この情報を民間が利活用し、私たちの生活が良くなり、起業もしやすくなるとかになるのでしょうかね。

国及び地方公共団体はオープンデータに取り組むことが義務付けられました。オープンデータへの取組により、国民参加・官民協働の推進を通じた諸課題の解決、経済活性化、行政の高度化・効率化等が期待されています。

https://www.digital.go.jp/resources/open_data/

オープンデータカタログサイト
営利・非営利を問わず二次利用可能なルールが適応され、機械判読に適しており、無償で利用できる公共データの案内・横断的検索を目的としたオープンデータの「データカタログサイト」です。

https://www.digital.go.jp/resources/open_data/

▼サイト

▽オープンデータ

▽意見募集サイト

▽参加者に対してコメントしたデジタル庁の「オープンデータ担当者さん」のコメント

▼デジ庁コメント

▽項目2から説明列が一個ずれている。多分他にも同じ間違いがあるので調べて直してほしい。

オープンデータ担当者さん 10/14 8:26
ご指摘ありがとうございます。ずれを確認致しました。
全体的に見直した上で次回改訂に反映させて頂きます。

https://digital-agency.ideabox.cloud/idea/02f61a2d-aefb-47cd-a9a4-28491a378509

 好きだな~こういうの・・次回じゃなくてすぐに直して上げたらよいのに・・。

▽項目定義書の項目名の確認

>公共施設
バリアフリートイレトイレ => バリアフリートイレ ?

>小中学校通学区域情報メタデータ
問い合わせ先_電話番号_内線番号 => 問い合わせ先_内線番号 ?

>学校給食献立情報
ビタミンA_ug、ビタミンA_ugRAE : 全角のアンダースコアが使われている
ビタミンB1、ビタミンB2 : 全角の数字が使われている

全体的に・・・
カッコが半角、全角で統一されていない(一部抜粋します)
半角:建物名等(方書)、料金(基本)、料金(詳細)
全角:連絡先備考(その他、SNSなど)、員数(数)

オープンデータ担当者さん 10/25 10:43
誤記、表記揺れ等のご指摘ありがとうございます。
全体を改めて見直し、正しい表現に修正・統一の上、次回改訂に反映させて頂きます。

・・・・・ノーコメント・・・・

議事概要
<1 デジタル改革関連法案における資料誤り等の当面の再発防止策(案)について>
・ (内閣官房 IT 総合戦略室から資料「デジタル改革関連法案における資料誤り等の当面
の再発防止策(案)概要」及び「デジタル改革関連法案における資料誤り等の当面の再
発防止策(案)」に沿って説明)
・ 案のとおり、再発防止チームとして「デジタル改革関連法案における資料誤り等の当
面の再発防止策」を取りまとめることについて、出席者において了承された。

なるほど・・当面か・・だからOKなんだな。。

▽整備すべきデータについて

オープンデータ担当者さん 10/12 11:40
下記4点については外部団体等によるフォーマットがあることから、従来より推奨データセット内ではフォーマットを規定しておらず、今回の見直しの対象外としているため「1.修正したデータセット」
https://www.digital.go.jp/resources/open_data/municipal-stan…
の「データ項目定義書一覧」に記載しておりませんが、自治体標準データセット(旧推奨データセット)としては従来通りのフォーマットで引き続きご利用頂く予定です。

・ボーリング柱状図
・都市計画基礎調査情報
・調達情報
・標準的なバス情報フォーマット

データセットの種別数で言えば既存(修正あり18件+修正なし4件)22件、新規9件で合計31件となります。分かりづらくて申し訳ありません。

https://digital-agency.ideabox.cloud/idea/01ed7e3f-77d7-479b-8f13-a33b04482a0d/comment/1b6591c1-972f-4fee-b635-088e0554d405

▽オープンデータの推奨データセットの見直し案に対する意見

オープンデータ担当者さん 10/14 13:46
ご意見ありがとうございます。
1点目については2.に近く「システム内部から吸い出したり、それを一部加工したもので、誰でもダウンロードして自由にデータを利活用する際のデータセット」となります。
2点目については今後の検討の参考とさせて頂きます。

https://digital-agency.ideabox.cloud/idea/7ecb7d96-a2fd-47f5-862a-86d448828e93/comment/c74a5d97-4b50-4264-b413-59d5dfbeff8c

自治体の「業務標準化システムへの推奨データセット出力機能の実装」について

「推奨データセット」が「自治体標準データセット」になって、データ定義の質が一段階あがり、GIFとの整合性が取られたのは大変いいことだと思います。一方、noteにも書かれている自治体など公開側の課題(データ加工の手間、人員不足など)や、利用側(企業など)の課題(データの正確性や鮮度など)については、今回の改定では対策がなされていないように思いますが、デジタル庁などで検討されていることや、お考えがありましたら、ぜひお聞かせいただけると幸いです。

また、同じくnoteの課題にも書かれている、自治体の「業務標準化システムへの推奨データセット出力機能の実装」についても、実装できそうかどうか、見通しを教えていただけると嬉しいです。

よろしくお願いします。

オープンデータ担当者さん 10/20 18:09
ご質問・ご意見ありがとうございます。
利用企業向けにはデータの質改善の観点よりオープンデータ一覧及び各データセット項目の拡充が今回の中ではいちばん大きな変更点と考えております。
「業務標準化システムへの推奨データセット出力機能の実装」については最終的に目指すべき姿と認識しており、引き続き検討を進めて参ります。
「デジタル庁で一元的に自動収集・公開」についてはデータカタログサイトdata.go.jpについて、現在e-Govとの統合作業を進めており、その中で自治体のオープンデータも段階的に掲載できるよう運用面を含めた検討を行っております。

https://digital-agency.ideabox.cloud/idea/6180f9e8-bd92-417c-a7a7-31115235c850/comment/3be4df0c-f648-43f2-847c-6dc01fd99631

 業務標準化システムへの推奨データセット出力機能の実装は必須だと思います。ただ、ゴリゴリのプログラム実装しなくても良いんじゃない??ガバメントクラウド上で業務標準化システムにAPIを置いてもらって、デジタル庁システムが照会すれば良いじゃん。
 だからテーブル定義も共通化しないといけないんですよねっと、2年前から私も含め、結構な人がデジタル庁(含、CIO時代)に提言していたんですがね。。OCIもガバメントクラウド対象になったので、DBaaSしましょうか・・。いず分散台帳もスムーズかと思いますよ。

▼私の書き込み備忘録

ここから先は

1,969字

¥ 100

この記事が気に入ったらサポートをしてみませんか?