見出し画像

目下、話題の「政府、教育データを一元化」について

1月7日に牧島かれんデジタル大臣の記者会見について報道された記事、例えば「政府 学習履歴など個人の教育データ デジタル化して一元化へ」が出てから、SNSでは「#教育のデータの一元化に反対します」というハッシュタグとともに、批判の声が上がっています。

 

SNSには「一体誰がこういうことを思いつくのか?」という疑問を投げかける投稿もありました。

 

これに関わった人の一人は私です。そして、最初に明言しておきますが、国は、個人の教育データを一元的に管理することは全く考えていません

 

そもそも牧島大臣のご発言は、同日に発表になった「教育データ利活用ロードマップ」がもとになっています。デジタル庁だけでなく、教育データ整備に関わる4省庁(デジタル庁、総務省、文科省、経産省)の連名で、まさに今後の教育データの利活用とそのための環境整備について方向性を示したものです。

 

報道を契機に誤解が広まっているようですし、SNSには「何故こんなことをする必要があるのか」と言う声もありましたから、これを機会に私自身の考えを述べておきたいと思います。ただし、このnoteは私個人の見解であり、デジタル庁の公式見解ではありませんことを事前にお断りしておきます。

 

まず、私について。普段は慶應義塾大学で教育経済学の研究をしています。「『学力』の経済学」の著者だと言えばわかっていただける方もいるかもしれません。そして9月1日から非常勤でデジタル庁の「デジタルエデュケーション統括」という仕事を始めました。私自身は研究者ですから、日頃から教育データのユーザーなのですが、日本における教育データの利活用は、海外と比較すると大きく後れを取っており、これを何とかできないかと考え、この仕事に応募し、昨年6月に閣議決定された「デジタル社会の実現に向けた重点計画」において作成されることが決まっていた「教育データ利活用ロードマップ」に関わる機会を得ました。

 

SNS上で批判が高まっている理由について考えてみると、先述の記事のタイトルそのままに、国が個人の教育データを一元的に管理し、いつでもそれを自由に覗き見て、誰かの成績が悪かったり、欠席が続いていたりするとマークされて、進学や就職において差別の対象になるのではないか、という不安を持つ人が多かったからではないでしょうか。私も、もし何も事情を知らずに、この記事を読めば、「気持ち悪い話だなぁ~」と思ったに違いありません。

既に述べましたが、まずとても重要な点を繰り返し強調しておきます。国は、個人の教育データを一元的に管理することは全く考えていません。それどころか、42頁及び43頁にも、わざわざ赤字で「国が一元的にこどもの情報を管理するデータベースを構築することは考えていない」と記載しています。このことは1月11日の牧島大臣が閣議後記者会見でもご発言されていますし、「教育データ利活用ロードマップに関するQ&A」にも記載されています。


「教育データ利活用ロードマップ」の11頁には、データの管理は、例えば出欠であれば学校が、公教育の中における学習履歴は生徒本人が、というように、これまで通りの「分散管理を基本」とすると明記しています。「教育データ利活用ロードマップ」の9頁にある「教育データの蓄積と流通の将来イメージ(アーキテクチャ:初中教育)」の図を見た方の中には、塾の学習履歴なども国に一元管理されるとご心配をされた方がいたようですが、これも事実ではありません。なぜなら、11頁をご覧いただければわかるように、このデータ利活用の関係者に「国」は列記されていないからです。


では何をしようとしているのかというと、「学校や自治体間でばらばらの記載方式になっているデータを標準化し、必要に応じて連携できるようにすること」です。

 

どのようなケースでデータを連携する必要があるのでしょうか。それは、42頁に記載のある「データ連携による支援が必要な子どもに対する支援の実現」がその1つです。これについては後半で具体的に説明したいと思いますが、既に昨年の11月26日に小林史明デジタル副大臣を中心に、4省庁の副大臣を構成員とする「こどもに関する情報・データ連携 副大臣プロジェクトチーム」が開催されました。この会議の場で、小林副大臣、山田太郎デジタル大臣政務官をはじめ関係者からは、再三、「国が一元的にこどもの情報を管理するデータベースを構築することは考えていない」という発言がありました。こうした経緯があるにもかかわらず、どうして「政府 学習履歴など個人の教育データ デジタル化して一元化へ」などという記事になるのか、理解に苦しみます。あえて国民の誤解や不安を惹起するような報道の仕方をしていると言わざるを得ません。

なお、この報道が出た後の閣議後記者会見で牧島大臣は、「本件に関して1点付け加えさせていただきたいのですが、一部報道で一元化という表現が使われているのを拝見しております。私どもとしては、国が一元的にこどもの情報を管理するデータベースをつくるということは考えておりませんので、そのことを重ねて申し上げさせていただきたいと思います。まずは自治体でのデータ連携の事例をつくっていきながら、全国の自治体への展開に向けた必要な方策を検討していきたいと考えております。なので、一元化ではなくてデータ連携でございます。」と発言されています。


しつこいようですが、大切なことなので、もう一度言っておきます。国は、個人の教育データを一元的に管理することは全く考えていません。 


しかし、このような記事が出たことで、「教育データ利活用ロードマップ」に注目が集まり、議論が行われることは重要です。これは、デジタル庁を含む4省庁が9月から集中的に検討し、多数の関係者にもヒアリングにご協力を頂き、そこでの貴重なご意見を踏まえつつ取りまとめてきたものです。この機会に、「教育データ利活用ロードマップ」が何を目指しているのかについて、ぜひ知っていただきたいと思います。

 まずは、何故このようなことをする必要があるのか。その「目的」を2つの例で説明したいと思います。1つは「プッシュ型の支援」の実現、もう1つは「個別最適な学び」です。

まずは、プッシュ型の支援について。これは、「教育データ利活用ロードマップ」の42頁の「データ連携による支援が必要な子どもに対する支援の実現」に記載してある内容です。下記の図は、私の研究室で、コロナ禍である2020年度中に認定NPO法人カタリバとともに、経済困窮世帯の児童・生徒とその保護者を対象にして行った調査です。そこで明らかになったことの1つは、経済困窮以外の課題を同時に抱える子どもが、実に全体の40.2%にも上るということです。経済困窮に加えて、19%が発達障害、7%が身体障害があり、13%が不登校になっています。ここにひとり親を加えると、70%以上が複数の課題を抱えていることになります。しかし、行政の視点で見てみると、発達障害や身体障害は健康・保健関連部署、不登校は教育委員会、経済困窮は福祉関連部署の担当であり、行政の縦割りによって、保健・教育・福祉の所管横断的な情報共有が妨げられ、複数の課題を抱える子どもに対する支援が十分に行われているとは言えません。この結果、下の図1でも示される通り、経済困窮以外の複数の課題を抱えている子どもたちは、経済困窮のみの子どもたちと比較すると、授業理解度やや自己肯定感が低く、不安感が強いという結果になっています。そもそも、経済困窮世帯の子どもは学力が低い傾向がありますが、複数の課題を抱えると更に低くなってしまうというわけです。

図1:経済困窮世帯の子どもと複数の課題を抱える子どもの比較

(注)2020年10月に認定NPO法人カタリバとともに経済困窮家庭の児童・生徒と保護者222人を対象に実施したアンケート調査に基づく。平均0、標準偏差1に標準化した値を示しており、すべての変数で2群の間に統計的に有意な差がある。SDQ(Strength and Difficulties Questionnaire:子どもの強さと困難さアンケート)は子どもの情緒や行動についての25問の質問を集計したもので、数字が大きいほど困難度が高い。

(出所)中室(2020)「子ども庁何を優先すべきか㊤ 縦割りの排除、自治体でも」(日本経済新聞、経済教室)


子どものいる経済困窮世帯を支援している団体の関係者に話を聞いても、子どもが複数の問題を抱えている場合は、あちこちの部署をたらいまわしになり、必要な支援を得られるまでに相当の時間がかかったという話を耳にします。あちこちの部署で、何度も同じような説明をし、何度も同じような申請書類を書かねばならないわけですが、経済的に困窮しているというのに、平日の昼間から仕事を休んでそんなことをせねばならないというのは大変なことです(ちなみに、海外では大学入試と奨学金の手続きが面倒臭いことが、低所得家庭の大学進学率を押し下げていることを示した研究があるほどです)。ですから「ワンストップ型」の支援を実現すること、そして「プッシュ型の支援」または「アウトリーチ」といって、支援を必要とする人からの申請を待つのではなく、個人情報の保護を前提としたうえで、行政から働きかけを行うことが重要です。

 

「教育データ利活用ロードマップ」の目的の1つは、まさにこのような「ワンストップ型の支援」や「プッシュ型の支援」を行うためのデータ連携です。実は、これはデジタル庁の中で突如として始まった構想ではありません。河野太郎行政改革担当大臣(当時)の下で実施された2020年度の「秋の行政事業レビュー」(子供の貧困・シングルペアレンツ問題(II)の中で、慶應義塾大学の宮田裕章慶應義塾大学教授ら複数の有識者から、子どもの貧困問題に関し、要望を待たずに行政が支援を行う「プッシュ型の支援」を行う必要があるという指摘がありました。その後、河野大臣のリーダーシップで、内閣府に「貧困状態の子供の支援のための教育・福祉等データベースの構築等に向けた研究会」が設置され、山野則子大阪府立大教授を中心に検討が進められてきました。今回の「データ連携による支援が必要な子どもに対する支援の実現」は、この内閣府における会議での検討を踏まえて行われるものであり、1月21日に開催された「こどもに関する情報・データ連携 副大臣プロジェクトチーム(第2回)」においても、同研究会での検討状況が報告されています。


リスクの高い児童・生徒に早期に介入し、救済をしたいと考える自治体のニーズは強く、一部の自治体は既に自前で自治体内の情報共有を行うための仕組みづくりを開始しています。例えば、大阪府箕面市、茨城県つくば市、兵庫県尼崎市などでは、個人情報保護条例を遵守しつつも、行政や教育委員会が管理するデータを連携し、貧困、虐待、不登校、障害などを持つ子どもに対するプッシュ型の支援を展開する試みを始めています。三重県では、産業技術総合研究所と共同で人工知能(AI)を活用した児童虐待対応支援システムを構築しています(これらについては、資料も公開していますので是非ご覧ください)。デジタル庁の「データ連携による支援が必要な子どもに対する支援の実現」は、こうした自治体の取り組みを更に後押しするために行われます。

 

SNSには、データ連携などよりも、児童相談所の人員増こそ必要であるというご意見もありました。私自身も、児童相談所の人員増、特に児童福祉に関わる専門人材の育成は必須だと考えていますが、現実には虐待件数は、職員数の増加をはるかに上回るペースで生じており、職員の人員増とともに、支援の「質」の向上も重要です。児童福祉法で定められた「要保護児童対策地域協議会」(いわゆる要対協)では、要保護・要支援の対象となる子どもの数が増加しすぎて、個々のケースについて十分な検討を行うことができず、虐待による死亡を生じさせてしまったという反省もあり、厚労省はかねてから要対協における機能強化として、「情報共有」のあり方の見直しが必要との認識を持っています。


ここまで長く説明をしてきましたが、データ連携をすればどのようなことがわかって、どのように支援につなげることができるのか。そのイメージをつかんでいただけるよう、具体的な例とともに説明したいと思います。既にご紹介した兵庫県尼崎市の「学びと育ち研究所」では、大学の研究者と共同で行政記録情報を連携したデータ分析が始まっています。このデータは匿名化されており、児童・生徒の氏名や住所など、個人を特定できる情報は一切含まれていません。このデータを用いた分析を手掛ける研究者の1人である山口慎太郎東京大学教授は、小学校に就学する前に幼稚園にも保育所にも通わない、いわゆる「無園児」がどのような環境に置かれているのかと言うことを明らかにしています。その結果、無園児の子どもは、そうでない子どもと比較すると、生活保護受給家庭の子どもが多く、3か月健診や3歳児健診にも不参加である確率が高い傾向があることが明らかになりました。幼稚園や保育所は義務教育ではありませんから、行かなかったとしても個人の自由です。しかし、この分析から、幼稚園にも保育所にも通っていない子どもは、日頃接する保育士さんや保健師さんなど家族以外の大人の目が届きにくく、行政の支援から漏れてしまっているリスクの高い子どもであるかもしれないことがわかります。このように健診、貧困、就学などの所管の異なる情報を組み合わせて分析することで、「どのような子どものリスクが高いのか」「どのように支援すべきなのか」ということを考えるうえで非常に重要な情報となります。このようにデータと科学的な手法を用いて示されたエビデンス(科学的根拠)を用いて、より効果的な政策を行おうとする動きのことを「エビデンスに基づく政策形成」(EBPM)といいます

 

こうした分析は、「予防的支援」にもつながります。過去のデータからどのような子どものリスクが高いかがわかっていれば、先回りして健診に来なかったり、あるいは幼稚園や保育所に申し込みがなかった時点で行政側からアウトリーチを行い、支援を開始することが出来るかもしれないからです。もし予防的に支援を行い、問題が生じる前に解決できれば、行政だけでなく、何より子ども本人の負担を軽くすることができます。「予防的支援」という考え方は教育や福祉の分野でも重要になってくることは間違いありません。

 

課題を抱える子どもたちに対する「プッシュ型の支援」の実現のために、データ連携を行うのだと説明すれば、多くの人が納得してくださるのではないかと思います。しかし、今回の報道で多くの人が心配になったのは「学習履歴の連携」なのではないでしょうか。なぜそのようなものを連携する必要があるのでしょうか。そのことについても触れておきたいと思います。

 

最近、文科省が主導する「GIGAスクール構想」によって、小中学校に1人1台端末が整備されています。コロナ禍もあって、海外でも「1人1台端末」を整備した国は多く、その効果検証をした論文がこのところ多数に出版されました。一連の研究の含意は、「単に1人1台端末を整備するだけでは子どもたちの学力を上げることはできない」ということです。ペルー、コロンビア、ルーマニアなどでは1人1台端末が学力に与えるプラスの効果はないという結論になっているほか、子どもたちが動画を見たりや音楽を聞く時間が増加した結果、むしろ学力は低下したことを示した研究もあるほどです。ですから、単に1人1台端末を整備するだけでは不十分で、その端末をどのように使うかということが重要になってきます。

 

そして、一連の研究は、1人1台端末政策がうまくいくかどうかは、端末の導入によって、子どもたちの認知特性に応じた「個別最適な学び」が実現できているかどうかが重要であることを示唆しています。「個別最適な学び」は、英語ではTeaching at the Right Level(TaRL)と言って、2019年にノーベル経済学賞を受賞したマサチューセッツ工科大のアビジット・バナジー教授やエスター・デュフロ教授を中心に、既に相当の研究蓄積があり、いずれの研究でも比較的大きな効果が見られていると言って差し支えありません。

 

そして、個別最適な学びを実現する上で、デジタル教科書とともに必要となるデジタル教材の開発は、民間事業者が担っています。経済産業省が主導した「未来の教室」実証事業もあり、多くの公立小中学校がこれらの教材を利用し、成果を上げています。そして子どもたちの学習履歴のデータを、特定の個人が識別されない匿名化されたデータとして連携することで、民間事業者が提供するサービスの質を向上させることができるのです。

 

具体例を出して、サービスの質を向上させるために、「データの大きさ」が重要であることを説明しましょう。私たちの研究室でデータ分析を担当している「埼玉県学力・学習状況調査」は、埼玉県下の62自治体の約1100校の公立小中学校の小4~中3までの児童・生徒約30万人が受けている学力テストで、生徒の学習到達度が示されます。そして、例えば2021年の国語で言えば、最も高い学習到達度の児童・生徒と最も低い学習到達度の児童・生徒はいずれも750人程度(約0.3%)存在しています。つまり、0.3%の児童・生徒が飛びぬけて学力が高いのに対し、同様に0.3%の児童・生徒はかなり学力に課題がある状態だということになります。おそらく、彼ら彼女らの多くが、学校の授業は「ただひたすら座っているだけ」という状況に陥っているでしょう。学力の高い生徒は簡単すぎてつまらないでしょうし、低い生徒は授業についていくことができない。そこで、子どもによって異なる認知特性に応じた「個別最適な学び」が重要になってくるのです。これからは平均点周辺の子どもだけでなく、多様な認知特性を持つ子どもらにも個別最適な学びを提供し、各々が新しいことを学ぶ喜びを知り、自分の能力を伸ばしていくことができる教育が求められているのです。

 

当然のことながら、平均点周辺には多くのデータがありますが、極端に学力が高いとか低いとデータの数は少なくなります。例えば先の埼玉県のデータであれば、750人もいるのだから、これ以上、他の学校や自治体とデータを連携しなくても、十分分析できるのではないかと思われる方もいるかもしれません。しかし、小・中学校別に、あるいは学年別に分析するとなると、埼玉県ほど大きな自治体でもデータの数は非常に小さくなってしまいます。つまり、データが大きくなれば、様々な認知特性の子どもにあった学習方法の開発ができ、授業で「ただひたすら座っているだけ」という子どもを減らすことができるのです。ここでは学力に絞って説明しましたが、「個別最適な学び」は、学力だけでなく、子どもたちの様々な能力を伸ばすためのものであるべきでしょう。


そして、とても重要なことは、データの連携は、(デジタル社会形成整備法による改正を含む)個人情報保護法(または条例)に基づき、その利用目的に応じ、連携した情報にアクセスできる主体は厳格に規定され、運用されるということです。「教育データ利活用データマップ」の19頁にも「機関間の個人情報等の連携は、法令に基づく場合等を除き、原則として本人の 同意により提供」される旨、赤字で明記されています。同じく34頁にも「行政機関、地方自治体、研究機関や民間事業者等の教育データを利活用する者において、個人情報の保護に関する法律(デジタル社会形成整備法に基づく改正等を含む)に基づく個人情報等の適正な取扱いを確保する」ことが明記されています。


つまり、行政や民間事業者が、興味本位で、子供たちのプライバシー性の高い情報を自由に閲覧できるような状況には決してなりません。この点を改めて強調しておきたいと思います。そして、ここまでお読みいただいてお気づきになった方もおられると思いますが、実はデータ連携をした時に、必ずしも氏名などの個人情報は必要がないというケースは多いということです。分析を行う段階に限れば、個人を特定できる情報を扱う必要はありません。学術研究で用いられるデータの多くは、特定の個人を識別することができないように加工されています。


とは言え、多くの人が心配になるのは、本当に正しい目的のためだけに使われるのか、と言うことではないでしょうか。実はこれはかなり難しい問題です。ある人から見れば正しくとも、別の人から見ればそうではないということはあり得るでしょう。そして、たとえ匿名化されたデータであったとしても、分析の結果、不利益を被る人が出てくるかもしれない。そういう人に対してどのような配慮をするか、と言うことが重要です。専門的な言葉になりますが、EUにおけるGDPR(一般データ保護規則)のプロファイリング規制などについても研究を深めながら、関係省庁とともに継続的に検討をしていく必要があります。

 

私自身のTwitterにも、「地獄への道は善意で舗装されているのだ」と警鐘を鳴らしてくださった方がおられました。様々なデータ分析についてご相談のある私の研究室にも、時々、受験や就職における差別やスティグマを生み出しかねないのではと懸念されるようなものがありますから、不適切なデータの使い方をしようとする人が出てくることを完全に排除することは難しい。そのことは私自身もよく承知しているつもりです。企業の内定辞退者の予測を行い、それを販売していたことで批判の対象となった企業が批判されたことは記憶に新しいところです。米国の連邦取引委員会も、ビッグデータを用いて個人の信用リスクの予測を行い、それに基づいて取引をするかどうかを決める企業に警告を発したことがあります。データ分析では「完璧な答え」を導き出せるわけではありませんから、それによって個人の可能性や挑戦の機会を奪うようなことがあってはならないのです。このため、「教育データ利活用データマップ」の34頁には、「教育データを利活用して、児童生徒個々人のふるい分けを行ったり、信条や価値観等のうち本人が外部に表出することを望まない内面の部分を可視化することがないようにする。」ということも明記されています。

 

しかし、不適切な使い方をする人が現れるリスクを恐れてデータを使わないというのではなく、不適切な使われ方を許さないように、法律や制度でデータの使用方法をきちんと決めてておくということが重要なのではないでしょうか。例えば、献血をすれば、それによって助かる命があるかもしれないが、人々が善意で提供した血液を不適切な使い方をする人や不当な利益を得ようとする人が現れるかもしれません。しかし、だからと言って、「献血をしない」と言う判断をするのではなく、不適切で不当な使われ方がしない仕組みづくりについて、継続的に考えていく必要があるというのが私の立場です。


兵庫県尼崎市には、市が独自に設置した第三者で構成される「倫理委員会」があり、尊厳や人権、その他の倫理面での配慮が十分になされていることが確認された場合のみにデータ利用が可能になる許可制になっています。加えて、データ連携が先行している医療・介護の分野では、特に北欧諸国を中心に医療データのコントロール権は患者側にあるというコンセンサスが確立しています。「何も隠さないことこそ、信頼獲得のカギである」であるという哲学から、患者のデータがどのように使われたのか、そのことを患者自身が確認(トレース)できるようになっています。これは、データのコントロール権は国民の側にあることを明確にし、不適切で不当な使用が行われていないことを国民側から監視するという観点でも非常に参考になります。

 

「教育データ利活用ロードマップ」は複数のメディアが報じていますが、あえて国民の誤解や不安を惹起するような報道をしているものも散見されます。実は、私自身が過去に有識者として参加した「教育再生実行会議」でも、デジタル化タスクフォースが組成され、ここでもデータ標準化、学習履歴の利活用と個別最適化などに関する提言が行われました。これについても事実誤認を含む報道が行われ、後に記事を取り下げたメディアもあったほどです。政治や行政に対する不信感が根底にあることは個人としては理解できますが、それにしても正確な事実・表現に基づかない報道は感心できません。このような状況ですから、私からぜひ読者の皆様にお願いしたいのは、本件についてSNSでご自身の意見を表明される際には、ぜひデジタル庁のウェブサイトで公開されている「教育データ利活用ロードマップ」をご覧頂きたいということです。一次資料にあたらずに、報道を鵜呑みにし、自分の思いついたことを述べるということが大勢になれば、SNSは社会を悪くする方向にしか働かないと思うからです。

一方で、報道を契機として誤解や不安が広がることのないよう、「教育データ利活用ロードマップ」の全容を丁寧に説明していく必要性も感じます。これから、様々な場をお借りして、丁寧に説明をし、発信していきたいと考えています。デジタル庁では、「教育データ利活用ロードマップ」の公開にあたり、国民からの意見の募集をおこなっていました。官公庁では、このような意見募集を出す段階ではかなり内容が固まっていることも多いと聞きますが、今回は実際に頂いた内容を取り入れて、大きく内容を変えたところもあります。実際に、意見募集前の草稿をご覧になった方からは、「最終的に発表されたものがかなり変わっていて驚いた」というお声もいただいています。私自身もまだまだ勉強が足りませんから、引き続き様々な方からのご意見を拝聴しながら進めていきたいと思います。

 

また、学校現場の先生方をはじめとする教育関係者の皆様へ。ただでさえ多忙な教育現場に、また負担が増加するのではないかと不安を抱えておられる方も多いのではないでしょうか。ご心配には及びません。「教育データ利活用ロードマップ」の3頁にもあるように、当座の目標は、教育現場を対象にした調査や手続の原則オンライン化や、事務等の原則デジタル化などを進め、学校の負担を軽減することに集中します。学校現場の先生方にもデジタル化の恩恵があらねば、データは決して利活用などされないでしょう。デジタル化による学校の負担軽減を実現できるよう、力を尽くしたいと思います。


最後に。2020年に経済学のトップレベルの国際学術誌であるQuarterly Journal of Economicsに掲載された論文によれば、社会保険、教育、職業訓練、現金給付など、公共政策は多岐にわたりますが、過去50年にわたるアメリカの133の公共政策を評価したところ、もっとも費用対効果が高いのは子どもの教育と健康への投資であるということです。子どもの教育や健康への投資を行った政府の政策の多くは、子どもが大人になった後の税収の増加や社会保障費の削減によって、初期の支出を回収できていることも示されています。個人の可能性や挑戦の機会を奪うようなデータ利用を制しながら、多様な子どもたちに早期の、充実した支援を行うことができれば、子どもたちだけでなく社会全体が恩恵を受けることが出来ます。子どもの教育と健康への投資がより効果的なものになるよう、賢くデータを使う社会にできればと考えています。

この記事が気に入ったらサポートをしてみませんか?