DS Tsukuba

つくば市に住む研究者です。 データ分析や機械学習を専門としています。 趣味と公益を兼ね…

DS Tsukuba

つくば市に住む研究者です。 データ分析や機械学習を専門としています。 趣味と公益を兼ねて行政の公開データの分析記事を中心に執筆予定です。 博士(工学)

最近の記事

人流調査データでつくば市の通勤状況を可視化する

こんにちは。つくばに住む研究者です。 今回は人流調査データを使い、つくば市の通勤者の人流を可視化します。今回使うデータは、パーソントリップ調査データおよびそれを元にしたOD調査データです。 使用するデータについてまず、パーソントリップ(PT)調査について簡単に説明しておきます。下記は国土交通省からの引用です。 PT調査データによって、例えば「鉄道を利用してつくば市へ通勤する人」や「鉄道を利用してつくば市から通勤する人」などの人流の様子を知ることができます。 調査データ

    • つくば市の各地区の駅からの距離と平均年齢の関係を調べてみる

      こんにちは、つくばに住む研究者です。 以前、ヒートマップ(コロプレス図)を用いてつくば市の各地区の平均年齢を色分けしてみました。これを見ると、つくばエクスプレスの駅に近い地区では、そうでない地区に比べて平均年齢がかなり低い様子が伺えます。今回の記事では、この様子をjointplotを使って数字として図示したいと思います。 いつものように、国土地理院のデータを使います。データのダウンロード等については過去の記事を参照してください。 具体的な手順は以下の通りです。 各地区(

      • [Python]市町村ごとの「地盤の強さ」マップを作る

        令和6年能登半島地震につきまして、被災された皆さまに心からお見舞い申し上げます。 災害は平時の備えにより被害を大きく減らすことができます。 今回は自分の住むつくば市について「地盤の強さ」すなわち「揺れやすさ」をマップにして地域の地震の影響に対する理解を高めたいと思います。 今回は防災科学技術研究所が公開している表層地盤増幅率を使います。同データは日本の全国の地域についてまとめられていますので、つくば市だけでなく任意の市町村についてマップをつくることができます。なお、お住ま

        • つくば市の人口偏在についてPythonでグラフにしてみる

          こんにちは、つくばに住む研究者です。 前回はつくば市の各地区の駅からの距離と平均年齢の関係を調べました。 今回は前回作成したデータを利用して、人口のヒートマップを作ろうと思います。併せて、駅の周辺の人口密集度についても見ていきます。 さて、前回は国勢調査をもとにした人口データと国土地理院による各地区の座標データを紐付けしました。つまり、どの地区(座標)にどのくらいの人口が住んでいるかが既にわかっています。これをfoliumのheatmap pluginを使えばヒートマップ

        人流調査データでつくば市の通勤状況を可視化する

          Pythonでつくば市の交通事故件数のヒートマップを作る

          こんにちは、つくばに住む研究者です。 今回はタイトルの通り、つくば市の交通事故件数のヒートマップを作ります。利用するデータは国土交通省が公開している市の境界線の図形ファイル、同じく同省の公開する幹線道路の図形ファイルに加えて、警察庁の公開する交通事故統計情報のオープンデータです。 今回はつくば市について作成しますが、全国についてデータは公開されていますので、お住まいに任意の市区町村について作成できます。 まずは3つのデータを地図上に書き込んでいきます。いつものようにデー

          Pythonでつくば市の交通事故件数のヒートマップを作る

          つくば市の人口密度ヒートマップを作る[Python, GeoPandas]

          こんにちは。つくばに住む研究者です。 今回はいつも通りPythonを使い、公共のデータからつくば市の人口密度のヒートマップ(コロプレス図)を作ろうと思います。 データのダウンロード つくば市は特に人口増加の著しい街です。どの地域で人口が増加しているのかを地図上でみてみましょう。市内の細かな地域の変化について確認するため、小地域(町丁レベル)での統計情報をe-Statからダウンロードします。 今回は2005年と2020年の2つの年度についてヒートマップを作ります。 データ

          つくば市の人口密度ヒートマップを作る[Python, GeoPandas]

          つくば市の高齢化状況について[3]

          こんにちは。つくばに住む研究者です。 前回に引き続き、つくば市の高齢化問題について考えていきます。 つくば市は2022年度では最も人口増加率が高い自治体であり、全国の自治体と比較しても低い高齢化率となっています。今後、つくば市はどのようにして高齢化社会を迎えるのでしょうか? まずは平成27年(西暦2015年)10月に国立社会保障・人口問題研究所によって実施された人口推計(”つくば市人口ビジョン”)をみてみましょう。 分析のサマリは以下です。 この推計では人口が25万人

          つくば市の高齢化状況について[3]

          つくば市の高齢化状況について[2]

          こんにちは。つくばに住む研究者です。 今回は前回に引き続き、つくば市の年齢別の人口の増減を分析します。 Cohort分析を通して人口増加の偏りや高齢化の様子をみていきます。 使用するデータは前回と同様です。前回は国勢調査3回分のデータを使って人口ピラミッドを描写しました。 先細りになる全国・茨城の人口の様子とつくば市ではだいぶ人口の変化の様子が異なるようです。しかし、2013年の時点で一番のボリュームゾーンの年齢帯は35~39歳でしたが、2023年では45~49歳に移っ

          つくば市の高齢化状況について[2]

          つくば市の高齢化状況について[1]

          こんにちは。つくばに住む研究者です。 今回はつくば市の年齢別の人口構成についてみていきます。分析を通して、将来のつくば市の年齢構造や高齢化の問題について考えていきます。 今回は総務省の取りまとめる住民基本台帳のデータを使い、過去10年間での年齢別人口がどのように変わったのか見ていきましょう。次回以降ではCohort分析など、もう少し詳細な分析も行ってみたいと思います。 これまで見てきたように、つくば市は全国的に見ても平均年齢が低く、人口増加も最も著しい街の一つです。しか

          つくば市の高齢化状況について[1]

          【データで見るつくば】つくば市の保育所定員数と待機児童数の推移

          こんにちは。つくばに住む研究者です。 今回はつくば市の児童数と待機児童数の推移についてみていきます。 厚生労働省(R5年からはこども家庭庁)が発表する「保育所等関連状況取りまとめ」の資料を元にグラフを作成します。 今回使用したのは令和元年〜令和5年までの5年分のデータです。それぞれ、以下からダウンロードできます。 ・厚生労働省 ・こども家庭庁 このうち、資料1-1の前年からの定員数の増加数、また資料6-1および6-2にある待機児童数の変動数をグラフにしていきます。 今回

          【データで見るつくば】つくば市の保育所定員数と待機児童数の推移

          【データ分析】つくば市の財政指数の他都市との比較

          こんにちは。つくばに住む研究者です。 今回は自治体の財政指数について見ていきます。 全国の自治体の財務状況については、総務省が発表する「市町村別決算状況調」から確認できます。一般には、大都市圏を除き多くの市町村では地方税だけでは支出が賄えない実質的な赤字自治体であり、地方交付金による補填により運営をしています。地方自治体の独自税収だけで運営できる自治体である不交付団体は僅かです。 先の総務省のデータには、自治体の税収と支出から計算される「財政力指数」が含まれています。総務

          【データ分析】つくば市の財政指数の他都市との比較

          【データで見るつくば】つくば市の女性の雇用形態(従業上の地位)について

          こんにちは。つくばに住む研究者です。 以前、つくば市の女性について産業別の就業者割合について調べ、学術研究分野での就業者割合が全国で最も高いことがわかりました。今回は女性の就業者の雇用形態について、男性の雇用形態や全国平均と比較してみようと思います。 以前と同様に国勢調査データを使います。茨城県内のすべての自治体を利用すると図が大きくなりすぎるため、茨城県内の人口が上位の10市だけを図示します。 df_iba = df[(df['2020年_都道府県']=='08_茨城

          【データで見るつくば】つくば市の女性の雇用形態(従業上の地位)について

          【データで見るつくば】つくば市の小学校区の変遷

          こんにちは。つくばに住む研究者です。 前回は茨城県内の市町村毎の小学生数の推移についてみました。今回はつくば市内の小学校区の変遷を地図から見ていきたいと思います。 昨年は人口増加率がとうとう全国1位となったつくば市です。とくに15歳以下の人口比率が高いつくば市ですが、急激な人口増加によって小学校区はどのように変化したのでしょうか? 今回使うデータは、国土交通省のまとめる「国土数値情報 学校データ」および「国土数値情報 小学校区データ」です。前者は小学校の名称や所在地につ

          【データで見るつくば】つくば市の小学校区の変遷

          【データ分析】茨城県内の市町村の小学生数の推移について

          こんにちは。つくばに住む研究者です。 今回は茨城県内の各市町村について、小学生の数がどのように推移しているのかについて見ていきます。出典は学校基本調査の学年別児童数の集計結果です。今回はデータ形式などの諸々の事情から平成24年〜平成27年までの合計4年度分についてだけ見てみます。 最終的には↓こんな感じのグラフを作ります 各年度の児童数のデータをe-Statからダウンロードし、作業フォルダにおきます。使いやすくするために、それぞれのファイル名についてdict型の変数にし

          【データ分析】茨城県内の市町村の小学生数の推移について

          【データ分析】つくば市と似ている都市はどこ?

          こんにちは。つくばに住む研究者です。 前回はつくば市の産業別の就業者数の割合について観察しました。今回は小中学校に関するデータ分析も考えていましたが、その前に「産業別の就業者の割合からみて、つくば市と似ている都市はどこだろうか?」という疑問が湧いてきたので、やっていきます。 データ間の類似度を測る指標として、今回は「コサイン類似度」を使います。コサイン類似度は最近よく話題になる人工知能(AI)技術の中でも良く使われる数学の道具です。 コサイン類似度について 三角関数を

          【データ分析】つくば市と似ている都市はどこ?

          【データ分析】つくば市の産業別就業者の男女での割合の比較

          こんにちは。つくばに住む研究者です。 今回は前回の続きとして、つくば市の産業別の就業者数の割合について、男女別にグラフを作り、県や全国との様子と比較してみます。 前回はこんな感じのグラフを作りましたが、男女別に見てみると就業者割合はどのくらい違うのでしょうか? コードは前回のものと殆ど同じです。データの取り込みまでのところは割愛します。 df_new_m = pd.DataFrame(columns=occupation_type)df_new_m.insert(0,

          【データ分析】つくば市の産業別就業者の男女での割合の比較