見出し画像

趣味のデータ分析073_弱男 vs 弱女⑤_弱者男女の30年史a

069072で、2022年時点で、弱者男女のどちらが多いか、また彼/彼女らの所得がどのようなものかを分析してきた。結果として、弱者男女は数も割合もその分布も、かなり似通っていることが判明した。

さて、これまでの分析は、就業構造基本調査の性別配偶関係別所得別のデータをベースにしつつ、学歴(在学か卒業者か)を仕分け、さらに国勢調査で無職の補正を行う、という面倒なことをやっていた(ついでに言うと、国勢調査ではなく就業構造基本調査内で無職データが取得できることも後で判明した。まあ致命的なミスにはなってないと思うけど。。。)。
特にこの「学歴仕分け」が地味に厄介で、データ的に2022年のものしか取得できない。ただ、学歴仕分けを外し、就業構造基本調査の中で無職データを取得するようにすれば、なんと(部分的にだが)1987年から経時的に推移をとることができる。今回は、弱男弱女の歴史をたどってみよう。

母集団の全体像

今回のデータは、なんと1987年から取得可能である。補足にまとめた通り、データの連続性は細かく見ると(見なくても)問題含みだし、学生を除いていないという意味で、そもそも根本的に前回とはデータが異なる。基本的に有業者を対象としているという点は共通だが、日本は失われた30年間で女性や高齢者の社会進出が進み、有業者のユニバース自体も大きな変化がある。
というわけで、まずは有業/無業のユニバースの変遷を、図1で確認しよう。各時点の和は、日本の15歳以上人口であり、少子高齢化の影響を免れないことも注意してほしい。

まず、補足にもまとめたが、まず1997年前後で、未婚の定義に断絶がある。特に高齢女性は男性より長生きするため離死別が多いが、これが1997年以前は未婚、より後はその他に含まれるため、データ上断絶が大きい。それ以外の特徴は、以下のような点だろうか。
・有業人口について、男性はほぼ横ばい、女性は、特にその他が牽引する形で増加傾向。
・裏腹に、男性の無業割合は特に1997年~2007年の間で増加。女性に関しては逓減している。
・男性のその他有業構成割合は、コンスタントに減少。

図1:性別配偶関係別有業無業区分別人口と構成比の推移(15歳以上)
※1997年以前の「未婚」は、「有配偶でない者」
(出所:就業構造基本調査)

男性のその他有業≒既婚有業男性の割合がコンスタントに減少しているのは、家族構成の変化としても興味深い。穴埋めは、2007年以前は、未婚有業とその他無業≒退職男性の増加だが、以降はその他無業は横ばいで、主に未婚有業の増加である。こんなところでも未婚化が表出している。
一方で女性は、2007年以降で見る限り、その他無業≒専業主婦等の減少を、未婚有業、その他有業の増加で穴埋めしている。女性労働力の活用が進んでいる証左であろう。

所得分布の時系列変化・無職込み

ユニバースを確認したところで、次は、所得分布が各カテゴリでどのように変化してきたかを確認しよう。
所得区分は、最も粗い1987年、1992年区分を採用し、それ以降は再構成してこの区分に合わせる。また、1987年と1992年は、男性の配偶関係別データがないので、未婚とその他男性の当該年のデータは欠損していることに注意。

未婚男性

上記の通り、1997年以降のデータしかないが、実数だと、無職を除けば1997年が若干右にテールが厚いように感じるが、構成比ではほとんど重なっている。弱者男性の所得分布には、あまり変化がない可能性が示唆される。

図2:未婚男性の所得分布の実数(15歳以上)
(出所:就業構造基本調査)
図3:未婚男性の所得分布の実数(15歳以上)
(出所:就業構造基本調査)

その他男性

その他男性は、実数も構成比も、割と顕著に1997年のテールのほうが右に分厚い。図1では、その他男性の無業率が2007年以降上昇しており(高齢化の影響の一端だろう)、構成比はその分下駄を履いている可能性はあるが、未婚男性とは対照的とも言える。

図4:その他男性の所得分布の実数(15歳以上)
(出所:就業構造基本調査)
図5:その他男性の所得分布の構成比(15歳以上)
(出所:就業構造基本調査)

未婚女性

未婚女性は1987年からデータ取得が可能で(未婚の定義の差には留意)、実数でも構成比でも、時系列でテールが右に移動しているのが分かる。1997年以前は、夫と離死別した高齢女性がここに含まれるので、その分の割引は必須だが、ここまで差があるなら、テールの右偏移は有意に発生していると考えてよいだろう。

図6:未婚女性の所得分布の実数(15歳以上)
(出所:就業構造基本調査)
図7:未婚女性の所得分布の構成比(15歳以上)
(出所:就業構造基本調査)

その他女性

その他女性は逆に、実数ベースでは2007年以降の方が無職が多い。繰り返しになるが、図6と逆に、2007年以降夫と離死別した女性がこっちに含まれるようになったためである。
未婚女性よりややわかりにくい感じだが、こちらも、時間を経るほど、右側のテールが厚くなっている。離死別女性が含まれてもなお分かる程度のテールの厚みの変化。専業主婦はバブル時代の夢、と以前書いたが、既婚女性でも働いて稼ぐというように、徐々に時代は変わってきたのだな、ということを感じる。

図8:その他女性の所得分布の実数(15歳以上)
(出所:就業構造基本調査)
図9:その他女性の所得分布の構成比(15歳以上)
(出所:就業構造基本調査)

まとめ

弱者男女の時系列比較として、まずは母集団と所得分布の変化を確認した。配偶関係の断絶があり、また高齢者も含まれるため、はっきりとは論じにくいが、弱者男性の所得分布は時系列で大きな変化はなく、弱者女性は右にテールが偏移していると言えるだろう。
特に無職部分は変動が大きいので、次回はその辺を処置しつつ、分析を進める。

補足、データの作り方

取得データ

これまでの就業構造基本調査は、全国編の人口・就業に関する統計表からデータを取得してきた。かなり横断的かつ多様なクロスでデータが取得できるが、冒頭述べたとおり、性別配偶関係別所得別学歴別のデータは、2022年しか取得できない。というか、性別配偶関係別所得別のデータも、2022年しか取得できない(非正規限定や世帯所得なら取得可能)。
しかし、地域編の人口・就業に関する統計表では、なぜか性別配偶関係別所得別のデータが取得できる。謎である。こちらのデータはタイトル通り、都道府県別だったり政令指定都市だったりの区分で取得できる代わりに、全国編の一部の仕分け、クロスのデータしか取得できない、という感じとなっていて、地域編の全国合算=全国編と同じ、という形になっている。そして、性別配偶者別所得別は、2017年~2007年は、なぜか全国編にないのに地域編には収められており、そこの全国合算を取得すればよい、というわけだ。
さらに、2002年はなぜかデータが欠損し、1997年~1987年は、全国編に収録されている。

いずれにせよ、e-stat、というか総務省データにはこういうひっかけがあるので正直やめてほしい。検索機能もあるが、結構ピーキーでうまく結果を出すのが難しい。
備忘として、所得を含むデータについて、各年の統計名と表題を整理しておく。

1987年
 就業構造基本調査 昭和62年就業構造基本調査 全国編(平成4年様式に組替)ー従業上の地位・雇用形態(4),所得(12),男女別・配偶関係(4),1年前との就業異動(4),有業者数,全国(1)

1992年
 就業構造基本調査 平成4年就業構造基本調査 全国編ー従業上の地位・雇用形態(4),所得(12),男女別・配偶関係(4),1年前との就業異動(4),有業者数,全国(1)

1997年
 就業構造基本調査 平成9年就業構造基本調査 全国編ー年齢(7),男女・配偶関係(5),従業上の地位・雇用形態(8A),所得(13A),1年前との就業異動(4),有業者数,全国(1)

2007年
 就業構造基本調査 平成19年就業構造基本調査 都道府県編(全国,全国市部,都道府県,都道府県市部,政令指定都市)ー男女,従業上の地位,雇用形態,起業の有無,所得,配偶関係,年齢別有業者数

2012年
  就業構造基本調査 平成24年就業構造基本調査 都道府県編(全国,全国市部,都道府県,都道府県市部,政令指定都市)ー男女,従業上の地位・雇用形態,起業の有無,所得,配偶関係,年齢別有業者数

2017年
 就業構造基本調査 平成29年就業構造基本調査 都道府県編(全国,全国市部,都道府県,都道府県市部,政令指定都市) 人口・就業に関する統計表ー男女,配偶関係,従業上の地位・雇用形態・起業の有無,所得(主な仕事からの年間収入・収益),年齢別人口(有業者)-全国,全国市部,都道府県,都道府県市部,政令指定都市

未婚データの扱い

1997年までは(特に1987年と1992年は女性のみだが)、有配偶と総数のデータしか存在していない。そのため、総数から有配偶を減算することで、未婚を算出している。それ以降は「うち未婚」で、未婚を直接算出している。つまり、1997年以前とそれより後で、離死別が未婚かその他か、どちらに含まれるか異なるということだ。
同じデータセットで離死別含む配偶関係のデータも取得できたが、これを見る限り、特に女性の離死別の影響は無視できない。

図10:離死別者の割合
(出所:就業構造基本調査)

さらに、いわゆるシングルマザーに低所得は多いなど、所得区分を導入すれば分布の偏りがあると考えられるが、いずれにしてもデータがなくて補正もできない。
なお、有業無業の区分のデータは、配偶関係の詳細を取得できる(つまり、1997年以前でも未婚者を直接取り出すことが出来る)が、定義を揃える関係から、所得を含むデータと同じく、総数から有配偶者を減算する形とした。

所得データの扱い

たとえば所得について、グラフ化した所得区分は、1987年~1992年の最も粗い区分で仕分けた(そうせざるを得ない)。以降の年は、詳細版を合算して各区分の数字を出した。
また所得については「総数」という、要するに全所得の人数の合算の生データがある。ただ前回も同様だが、この総数と、部分である各所得区分の人数の合算が合致せず、総数のほうが多い。この差分は所得不明の者であると考え、グラフでも、未婚データの扱いにも、所得総数のデータは一切参照していない。ちなみに、1992年以前の女性有配偶者は異常にデータが欠損しており、女性有配偶有業者データは、総数では1700万人いるが、所得データが取得できるのは1360万人しかおらず、欠損率は20%に及ぶ。

この記事が気に入ったらサポートをしてみませんか?