見出し画像

経済分析のためのデータサイト活用法

 30年くらい前まで、私の研究室は統計月報の類で埋め尽くされていた。そこからデータを拾って入力していた。
 いまは、ほとんどの経済データがウエブで提供されている。EXCEL形式で提供されていれれば、すぐにさまざまな統計処理ができる。信じられないほど便利になった。グラフも簡単に描ける。グラフを見れば、回帰分析などしなくても相関のあるなしが分かる
 他の国と比べても、日本は統計先進国だ。

検索エンジンだけでは、どこにデータがあるかは分からない
 しかし、日本の政府によるデータ提供は、満足のゆく状態ではない。
 例えば、人口は最も基本的な統計データだ。そこで、「日本の総人口の推移を過去50年間くらいにわたって知りたい」としよう。では、どこを探せばよいか?
 e-Statは、日本政府の統計ポータルサイトだから、ここには、人口の統計があるに違いない。
 しかし、トップページで「人口」と入れると、「検索結果に統計データは含まれておりません。 統計データは、「統計データを探す」からお探しください」という表示が出る。
 そこで「統計データ」を開くが、どこにあるか、すぐには分からない。「データベースから探す」の最初は「人口推計」。しかし、現時点のデータだけで、過去の時系列は分からない。「ファイルから探す」。下のほうに「長期時系列」とあるので開くと、2000年から2015年までしか分からない
「分野から探す」で「人口、世帯」を開き、「国勢調査」を見ると、5年ごとのデータだ。最新データは、国勢調査のあった2015年。それ以後は分からない
 多分、このあたりで疲れてしまって、諦めるだろう。
 
 検索エンジンによって、求めるデータがどのサイトにあるかが分かったとしても、きわめて多数の統計表があり、どれを見たらよいかが分からないのだ
 これは、人口統計に限った問題ではない。
 例えば、「労働力調査」には、 失業率、産業別就業者数などのデータがある重要なサイトなのだが、求めるデータがどこにあるのか、きわめて分かりにくい構造になっている。
 「毎月勤労統計調査」のサイトの構造も分かりにくい
 「消費者物価サイト」もそうだ。

 こうしたことがあるので、経済データは、検索エンジンだけでは探し当てられないことが多い。
 

◆ PDF形式では使いにくい
 データが見やすい形で得られても、それが分析に役立つとは限らない。分析のためには、グラフを書いたり、比率をとったりという作業を行なうので、データがEXCEL形式で提供されていることが必要だ。

 ところが、日本の官庁によるデータ提供は、データがPDFでしか提供されていない場合がきわめて多いのである。
 それがとくに顕著なのが、税・財政に関係するデータだ。予算や税に関するデータは、財務省の統計データは、似たような内容のものがホームページに雑然と掲載されており、非常に使いにくい
 しかも、驚くべきことに、財務省のページには、EXCELのデータはほとんどない。大部分がPDFであるため、分析には使えないのである。
 財務省のサイトに、「わが国税制・財政の現状全般に関する資料」というセクションがある。ここには、税収の推移や負担率など、税に関してしばしば用いる統計データがある。しかし、サイトの構成は分かりにくく、しかも、信じられないことに、データはPDFでしか提供されていない。
 国税庁のサイトには、エクセルのデータもある。しかし、すべてではない。
 財政研究所の『財政統計月報』には、  エクセルデータがある。その中には長期のデータもある。しかし、すべてではない。多くの人が使うであろう税収の区別収入は、何と、昭和60年までしかない
 地方税のデータは、総務省のサイトにある。このサイトでは、データは分かり易い形で提供されている。しかし、Excelで提供されていない

 予算にしても税にしても数字そのものである。だからデータは沢山持っているはずだ。しかも、元のデータはEXECELのはずだ。しかしそれを使いやすい形で国民に提供してはいないのだ。
 どのような施策を行っているかという宣伝的なものがあるのだが、財政を客観的定量的に分析するデータが提供されていない。
 「民は由らしむべし,知らしむべからず」という姿勢の表れだと考えざるをえない。

PDFをExcelに変換する方法
 Acrobatを持っていれば、次の方法でPDFをExcelに変換することができる:

・ウエブにあるpdfファイルをダウンロードする。
・Acrobatを開く。
・「ツール」で「PDFを書き出し」を選ぶ。
 書き出し形式にスプレッドシートを選択し、Microsoft Excelブックを選択。
「ファイルを選択」でダウンロードしたpdfファイルを選択。「書き出し」。

  Acrobatを持っていない場合には、ウエブにあるpdfファイルのスクリーンショットを撮り、それを Excelファイルに貼り付けるとよいだろう。
   その表を見ながら、必要な数字を Excelに打ち込むのである。

 なお、貿易統計のデータをExcelでダウンロードするための方法は、「データベース形式統計サイトの使い方」で述べた。

◆ 詳しすぎるデータもある
 国債の利回りは、非常に重要な経済指標だ。ところが、不思議なことに、日本では使いやすいデータがなかなか手に入らない。
 元データは、財務省の「国債金利データ」であり、このデータを参照せざるをえない。
 ところが、約40年間のデータが日次データとして提供されているので、分析にはきわめて不便だ。なぜ期間を区切るという当前のことをしてくれないのだろうか?あるいは、月次データ等の形で提供してくれないものだろうか?
  
◆ データベース方式の統計サイト
 印刷物の場合、統計表は一定の形式で提供されており、その形式自体は変えることができない。ウェブでデジタルで提供されるようになっても、この形式を踏襲した場合が多かった。典型的なものは内閣によるGDP統計である。様々な表が準備されている。
 ところが、暫く前から、データベース方式での統計提供がなされるようになってきた。これによると、利用者が、必要な項目、期間などを選べるようになっている。そして、エクセルファイルに時系列データがダウンロードできる。
 最初は最初は取りつきにくく感じるが、すぐに慣れる。極めて便利だ。
 これらのサイトの使い方は、「データベース形式統計サイトの使い方で述べた。

 ただし、すべての統計が使いやすいわけではない。例えば、法人企業統計では、極めて多数の項目(例えば売上高、営業利益等々)があり、それを業種別、企業規模別等に知る必要があるので、データベース方式は大変有用だ。しかし、使いやすくはない。
 項目が分類されずにずらずら並んでいるので、よほど慣れないと、必要な項目がどこにあるか分からない。

◆ e-Statでは、期間の指定が面倒
 多くの経済分析では、時系列データを用いる。だから、必要な項目を選択したあと、「::から**まで」と期間を指定できる形になっていると便利なのだ。
 日本のGDP統計では、期間の選択ができないので、表をコピーするときに一定期間だけ選んだり、コピーした表から言って期間を削除したりする必要がある。大した手間ではないが面倒だ。

 e-Statでは、期間の指定はできるのだが、「裏技」的な方法を用いないとできない

 消費者物価についてestatのデータベースを用いると、さらに面倒なことが起きる。デフォルトの設定では、月次データを取ると、月次データの途中に「年」「年度」の項目が混じるのだ。グラフなどに表わす場合には邪魔なので、これは消去する必要がある。これもいちいちそれをチェックしてはずなければならないので、面倒だ。
 だから、消費者物価については、データベースを用いず、従来と同じようにCSVファイルをダウンロードして、不要な部分を削除するほうがずっと簡単だ。折角データベース方式を導入しながら、古い方法のほうが便利だという皮肉な結果になっている。

 経済データは普通は項目を選び、その後に期間を選ぶというのが普通の利用方法なので、日銀、IMF、アメリカ消費者物価などのデータベースの方式で提供してくれるのが、一番使いやすい

 こういうことを見ていると、estatのサイトの設計者は、経済データを実際に日々に活用している人なのかどうかと、いつも疑問に思う。


「使える日本経済データ」ナビゲ―ションページ

「使える世界経済データ」ナビゲーションページ

ホームに戻る

メタ・ナビゲーション(野口悠紀雄noteの総目次)


この記事が気に入ったらサポートをしてみませんか?