見出し画像

職場からのNetwork Diffusion を利用した不動産需要の推定

導入

住宅需要の推計は、家賃や販売価格の設定、空室リスクの予測、交通資源が行き届いていない地域や過剰な地域の特定、適性区画の確立、適切/最適な土地利用の決定、その他経済や政策に関連する決定において重要である。住宅ユニットに対する需要は、部屋の特徴、建物の特徴、近隣の特徴、そしてより広いアクセシビリティの特徴の組み合わせに依存する。ここでは、地理空間データとネットワークデータを組み合わせた高度な分析を必要とする、より広範なアクセシビリティの特徴に焦点を当てる。

我々は、ヘドニック・プライシング・モデルを改善するための(とりわけ)典型的でカテゴリカルな地理空間変数ではなく、定量的な変数として立地の望ましさを測定する方法として、勤務地を起点とする住宅地需要を推定する方法を提案する。本アプローチでは、詳細な複合交通ネットワークを介した、勤務地から首都圏の各拠点への時間加重の潜在的な人の流れとして需要を計算する。

予備調査の結果、家賃と東京駅までの所要時間との相関係数は-0.714であり、対数価格との相関係数は-0.74であることがわかった。その地域に(他の需要よりも)雇用が集中していることから、雇用に基づく需要仮説をより深く検証することになった。多くの雇用(がある場所)にアクセスできる立地の利便性は、その立地の価値に直感的に結びつくが、この研究はその関連を正確に定量化することを目的としている。

方法

ここでは、我々の方法論を、データ、ネットワーク構築、ネットワーク伝搬を用いた需要推定の3つのトピックに分けて説明する。

データ

分析対象地域は東京主要都市圏である。図1に示すように、東京都内の通勤に関連する地域のみを含むように設計された、国道16号線にほぼ沿ったカスタム地域である。首都圏(東京都、埼玉県、神奈川県、千葉県)の面積の36%を占めるが、人口は首都圏の92%を占める。対象地域の人口は32,197,448人、給与所得者数は15,080,305人、面積は4,893km2である。

図1. 水色は首都圏4県、紺色は23区、中青色は東京主要エリア。

我々のウォーキング・ネットワーク・データは、オープン・ストリート・マップ(OSM)から得ている。OSMの "道路 "ネットワークを、歩行が可能で許可されているエッジにフィルタリングする。 (OSMのデータを手作業でクリーニングした後)駅の出口のノードはすでに道路ネットワークに接続されている。おおよその徒歩時間を持つアクセスリンクで、駅ノードを250m以内のすべての出口ノードに接続する。1440の駅ノードは、OSMとウィキペディアのデータから構築された電車ネットワークにも存在する。ウォーキングネットワークと電車ネットワークを統合することで、広大な東京主要エリア内の任意の2点間の移動時間を決定するための忠実度の高いシステムを手に入れた。しかし、地理的なエリアが非常に広いため、ウォーキングネットワーク上で長距離のルートを直接計算することは現実的ではない。その代わりに、近似的な(しかし正確な)所用時間を持つ簡略化された地理空間ネットワークを作成し、ウォーキングネットワークの代理として使用する必要がある。

地理空間Hexネットワーク

まず、道路セグメントを含まないHexを除いて、地域をカバーする内径250mのHexグリッドを作成する。137,221の各Hexは、Hexの重心とウォーキングネットワーク上の最も近い点(エッジまたはノード)の間にHexアクセスリンクを作成することで、ウォーキング・ネットワークに接続される。Hexノードは375m以内の駅ノードにも接続される。ある実験セットでは、すぐ近くのHexだけが接続され、別の実験セットでは、半径2近傍(510m以内)まで拡張される。「HexとHex」および「Hexと駅」の歩行時間は、ウォーキングネットワーク全体の所用時間として計算されたエッジの重みを持つ。30分以上かかるHexとHexのエッジ、15分以上かかるHexと駅のエッジは削除され、次に「Hex+電車」ネットワークを残してすべての道路エッジがネットワークから削除される。このようにして、問題を扱いやすくするためにエッジの数を大幅に減らしながら、(歩行可能なルートだけを含む)非常に正確な所用時間を維持する。

需要分析

ネットワークのHexもまた、分析に関連する量を保持し、データと結果を可視化するための直感的な単位としても機能する。給与所得者数の500m四方のグリッドデータから、グリッドの重心に重なるHexに需要源を割り当てた結果、ソースフローを持つHexは17,201となった。東京駅、日本橋駅、大手町駅周辺の繁華街に圧倒的に求人が集中しているが(図2参照)、副都心(新宿、渋谷、横浜など)にも無視できない数の求人が存在する。

図2. 500m四方のグリッドの経済データを250mのHexグリッドに転送した東京都心部での需要源。

各需要源のHexノードから、8つの時間重み付け割引関数を使用して、統合されたHex+電車ネットワーク全体に需要を伝播し、各Hexにおけるすべての需要源からの複合需要を評価する。ベースラインとして、ソースフロー値Djを持つソースjからのヘクスiにおける需要寄与dijを、式1の線形関数を用いて推定する(ここで、ijはヘクスiからヘクスjへの所用時間、T∈{60, 90}は拡散プロセスの計画期間である)。 また、λ∈{0.5, 1.0, 2.0}で式2を用いてパラメータ化された非線形割引関係を調べ、所用時間に対する感度の異なるレベルを捉える。図3は、50の雇用源と60分の計画期間を例にした、これらの関数のプロットである。 Hex iの総需要は、すべての需要源: Σj dijからの時間割引された需要の合計である.

図3. T=60の計画期間を用いて、従業者数(ここでは50)をその数に到達するのに必要な時間で割り引く関数のプロット。 λ値が高いほど、需要貢献の減少が遅れる。

結果

未加工の結果は、各バージョンの重み付け関数に基づく、Hexグリッド全体にわたる雇用源からの需要予測分布である。図4では、90分の計画区間における線形割引の結果を見ることができる。この分布は、どの割引関数でも定性的には類似しており、定量的には予想される点で異なっている。都心部に職が集中していることが、分布に明確な痕跡を残している。都心部に近い駅があるHexほど需要が大きく、駅から徒歩での距離が長いHexほど、拡散パターンがはっきりと目に見える形で表れている。その結果、推定された需要分布はロバストで直感的であるが、パラメタリゼーションを区別し、その精度を評価し、アプリケーションに有用な単位に変換する方法も必要である。

図4. 東京メインエリアの全Hexへの全雇用源からの90分線形割引ウェイトに基づく推定需要の分布。

これらの結果を評価するために、推定された需要とエリア全体の賃貸価格を比較する。まず、住戸の特徴の不均質性を低減するために、データベースから利用可能な賃貸物件の全セットをフィルタリングする。(1)2022年1月1日から2023年7月30日の間に価格が公表された物件、(2)2010年から2014年の間に建設された物件、(3)25-28㎡の広さの物件(ワンルームマンション)のみを対象とした。その結果、Hexのうち8,413戸(~6.65%)に、直近の価格が掲載された、同様の規模と築年数の356,744戸が見つかった。このことから、推定された需要と物件価格の相関関係を求めることができる。表1は、半径2のHexネットワークを用いた推定需要と賃貸価格のピアソンの積率相関係数を示している。半径1のHexネットワークでは、同様のパターンでわずかに低い値が得られる。

表1. 雇用源からのNetwork Diffusionによって推定される需要と賃貸価格との間のピアソン相関係数。

曲線的(λ=1.0, T=90)割引を用いると、相関が0.829と高いだけでなく、対数価格予測からの残差誤差のパターンは正規分布に近く、図4に示すように明確なパターンを欠く。他の重み付け関数の残差は、同じような相関係数であっても、明らかに非ランダムなパターンを示し、より歪んだ分布を示す。このことを念頭に置いて、より大きなヘドニック・プライシング・モデルに推定需要を組み込むために、この重み付けを選択した。

図4. 曲線(λ=1.0, T=90)の割引関数は0.829の相関を達成し、対数価格予測の残差のパターンは正規分布に近く、明確なパターンを持たない。

結論と今後の課題

純粋な(言い換えると、供給の制限や資産の変動を考慮しない)需要と価格との間には直接的な関係はないが、不動産価格の変動の80%以上が給与所得者の就業場所への距離によって説明できることを発見することで、部分的な検証を実証した。高い相関係数に加え、誤差の残差はベストフィットの線の周りにきれいに正規分布しており、価格の残りの変動は詳細なヘドニック価格モデルのより具体的な特徴によってきれいに説明できる可能性があることを示している。

これらの値は、おそらくすでに、雇用による需要の推定値で説明できる価格変動の限界に近いと思われるが、具体的な推定値をさらに改善するために、いくつかの改良を計画している。(例えば、勾配や追加的な移動手段や嗜好を取り入れるなど)ネットワーク横断時間の精度をさらに向上させれば、結果をさらに改善できる可能性がある。また、(学校、店舗、スポーツ施設など)追加の需要源を組み込む必要がある。その後、推定された需要を不動産評価のヘドニック価格モデルのベースとして使用し、統合された地理空間ネットワーク情報を持たない既存のモデルよりも大幅に改善されるかどうかを判断する。