国交省統計改ざん/二重計上問題の問題点と論点を整理する(2/4)

(1/4)国交省統計改ざん/二重計上問題の問題点と論点を整理する
(3/4)国交省統計改ざん/二重計上問題の問題点と論点を整理する
(4/4)国交省統計改ざん/二重計上問題の問題点と論点を整理する

(1/4)では、二重計上の原因となった「調査票の書き換え=改ざん」による「まとめ計上」が、2012年以前から(おそらくは統計の開始当時からずっと)行われてきたのではないかという疑念について述べました。

しかし、統計が実際に二重計上状態となったのは2013年の推計方法変更の後のことです。これはどういうことなのか見ていきましょう

2 「二重計上」はなぜ生まれたか

調査票の改ざん、まとめ計上と推計方法変更の関係

前の記事では「まとめ計上」=調査票改ざんのスキームが、2012年以前、おそらくは初期(2000年)から存在していたことに触れました。しかし、この時点では二重計上状態にはなっておらず、二重計上状態が生じたのは2013年からです

これはなぜでしょうか
この点については報道でも触れられていますし、記事(5)でも解説されています

大ざっぱに言えば、2013年に集計(母集団推定)方法の変更があり、それまでは0として扱われていた当月分の未回答業者の実績が「推定」されて母集団推定に組み込まれるようになりました

しかし、それにもかかわらず、従前の「まとめ計上」の運用は改められませんでした。そのため未回答業者について「当月の他業者の実績から推定された分」と「翌月以降に纏めて計上された分」が重複して計上されることになったのです

2.1 母集団推定方法の変更

改めて資料(3)を見てみましょう

まず「建設工事施工統計調査」と「建設工事受注動態統計調査」の2種類の区別に注意してください
今回問題になったのは「建設工事受注動態統計調査」の方で、これは「建設工事施工統計調査」に回答した業者の中からランダムで抽出(サンプリング)された業者が対象となっています。

「建設工事受注動態統計調査」の未回答業者については、ここでは考慮に入っていない(実績なしとして扱われている)ことにも注意して下さい

(なお、2021年度以降、「建設工事受注動態統計調査」の未回答業者も考慮されるようになりましたが、これはまた別の問題を引き起こしています。この点については後で触れます)

2012年度以前の母集団推定方法は次のように書かれています

この母集団に対して、各標本毎に定められる抽出率の逆数を各標本の調査結果に乗じることにより、母集団推定値を算出(復元)する。(未回答業者は実績なしとして取り扱う。)

https://www.mlit.go.jp/report/press/content/001408102.pdf

例えば「施工統計調査」の回答企業が10社あったとして、そこから半分の5社を抽出して「受注動態統計調査」の対象にしたとします。そのうち3社(A社~C社とします)から回答があり、それぞれ10億、30億、50億だったとします。合計すると90億です

抽出率は0.5なので、その逆数を乗じて90 x 2 = 180億が母集団推定値ということになります。ここで、(受注動態調査への)回答のなかった2社(D社、E社とします)の実績は推定に含まれない点がポイントです。

また、そもそも「施工統計調査」への回答がなかった業者についても、その実績は母集団推定には含まれていません

一方、2013年度~2020年度の母集団推定方法は次のように書かれています

この母集団に対して、各標本毎に定められる抽出率の逆数及び建設工事受注動態統計調査の回収率の逆数を各標本の調査結果に乗じることにより、母集団推定値を算出(復元)する。(建設工事施工統計調査の未回答業者は実績なしとして取り扱う。)

https://www.mlit.go.jp/report/press/content/001408102.pdf

2012年度以前の方法と比較すると、抽出率の逆数に加え、受注動態調査の「回収率の逆数」が乗じられている点が異なります

先と同じ例でいえば、回収率は0.6(5社中3社)なのでA社~C社の合計90億に1/0.6を乗じて150億、さらに抽出率(0.5)の逆数を乗じて300億が母集団の推定値となります。

これはすなわち、回答のなかったD、E社の実績がすべて、A~C社の実績の平均値である30億であると「推定」して母集団推定に繰り入れたということと同じです

2.2 改められなかった「まとめ計上」

さて、2012年度以前の母集団推定法では、受注動態調査の回答が未提出であったD社、E社は母集団推定に繰り入れられておらず、実績が0であったのと同じ扱いになります

従って、仮に「まとめ計上」が行われ、後から未提出分の実績が計上されても(まとめ計上自体の是非はともかく)遅提出分の実績が元の月次データと重複することにはなりません

しかし2013年度以降の方法では、母集団推定において、未提出業者の実績が既に推定されて組み込まれています。にもかかわらず、集計方法変更後も「まとめ計上」のスキームが維持されていました

このため「各月ごとの未回収業者の実績の推定値」と「まとめ計上によって翌月以降に計上された(実際の)実績」が重複してしまいます。これが二重計上の正体なのです

つまり、「未回収業者の実績を推定する手法が元々あり、そこへさらにまとめ計上(改ざん)を行うようになって二重計上になった」のではなく、「元々まとめ計上=改ざんのスキームがあったところに母集団推定方法の変更があり、その際にまとめ計上が改められなかったために二重計上状態が生まれた」のです
この区別は重要です

2.3 「集計方法の変更は民主党政権時代のもの」?

さて、この集計方法の変更について、産経新聞が以下のように報じました

自民党議員の質疑に国交省の官僚が答弁したもので、2013年の集計方法の変更(これは母集団推定方法の変更のことでしょう)は民主党政権時代に計画されたものであるという内容です

これ自体は事実でしょうが、この質疑はさっそくネット右翼的な人によって「改ざん、二重計上の原因はむしろ民主党政権である」というような印象操作に用いられているようです

しかしここまで見てきたように、2013年の母集団推定方法の変更は、「それまで母集団推定に組み込まれていなかった未回答業者の実績を推定して組み入れる」というものです。

まとめ計上の存在を前提としないなら、「母集団推定に組み込まれていなかった未回答業者の実績を推定して組み入れるようにする」という変更は、その手法の精度はともかく、目的自体は非合理なもではありません

問題は上記のように、この変更以前からまとめ計上=改ざんのスキームが(おそらくは非公式、秘密裏に)存在しており、また推定方法変更後もこのスキームが改められなかった点にあります

おざなりな理解で議論を進めてしまうと、どこかで追及が行き詰まるばかりか、逆にこのような野党/民主党政権への謂われなき批判を招き、それに対応することも難しくなってしまいます

一方で、ここまでの理解に従えば、「二重計上は、安倍政権の実績値向上(忖度)のために行われた」という可能性は低いのではないかと思われます。少なくとも、「二重計上状態を作り出すために調査票の書き換え(改ざん)を始めた」というような理解は明確に誤りだと言えるでしょう

とはいえ、「国交省は2013年の母集団推定方法の変更時に、二重計上状態になることを知りながら、まとめ計上=改ざんのスキームを意図的に改めなかったのではないか」という疑いを完全に否定することも依然としてできません。

政府はなぜ2013年の時点でこの改ざんスキームが改められなかったかを明らかにする必要があります。そしてそのためにはマスメディア、および野党の的確な追及が不可欠です。

これまで見てきたように問題は複雑なので、その構図を的確に整理、理解しなければ、的確な追及は望むべくもないでしょう。

複雑な問題を整理してその本質を明らかにし、市民に広く知らしめるのはマスメディアの重要な仕事です。しかし残念ながら現在の報道を見ていると、そのような状態に至っているとは思えません。

(12.24 追記)
朝日の初報のように、よく読めば「調査票書き換え(改ざん)」が二重計上状態になる以前から行われていた可能性が示唆される記述はあります。しかしあの記事を一見してそのように理解することは不可能に近いでしょう。

こちらのNHKの記事も、二重計上の原因については詳しく書かれていますが、「書き換え(改ざん)」が行われていた可能性については

……期限までに提出がなかった事業者についても、受注実績をゼロとはせず推計の受注額を計上しています。
しかし、事業者から期限に遅れて調査票が提出された際、都道府県の統計の担当者に翌月以降に合算して最新の1か月だけで受注したように調査票を書き換えることを指示していたということです。
その結果、推計値と過去の実績のデータの二重計上が発生したということです

また、国土交通省は、2013年度にデータの処理方法を見直したことが二重計上につながったことを明らかにしました。
2000年度にこの統計が始まった際には、期限までに提出がなかった事業者のデータはゼロとして処理していましたが、より実態に近づけるため2013年度以降は、推計値を入力する方法に改めたということです。
しかし、遅れたデータを翌月以降に合算する都道府県への指示も継続していたことから、二重計上につながったと説明しています

と書かれています。「遅れたデータを翌月以降に合算する都道府県への指示も継続していた」という一文から、2012年以前から合算=書き換えが行われていた可能性を読み取れないこともありませんが、明示的に指摘されているわけではありません。断定はできないにせよ、その疑念があることは明示的に書かれるべきではないでしょうか

私の知る限り、今のところ、二重計上が生まれた原因である「調査票書き換え(改ざん)」と「推計方法の変更」の関係、時系列を明確に整理したマスメディア報道を知りません(あったら教えてほしいです)
(追記終わり)

ひょっとするとマスメディア(の中の人)自身も、この問題を整理しきれていないのではないかと思います

以上、統計改ざん/二重計上問題の中心である改ざんのスキームと二重計上について見てきました。次は、追及、報道に伴って新たに見えてきた問題を取り上げたいと思います