図の資料が日本経済新聞のマネーのまなび欄にでていた。見たことがあるなと思いつつ,このデータを再現する簡単な分布関数 $n=f(x)$ (nは世帯数,xは金融資産値)を探してもらった。単調減少関数という条件を付けると,世帯数を再現するものは簡単に見つかったのだが,各区分の金融資産の積分値が一致しない。
以前の経験をすっかり忘れていた。低中所得層は対数正規分布で,高所得層はパレート分布(べき分布)にするのだった。今回,ChatGPT,Claude,Deepseek,Qwenなどにきいたが,いずれも以前より時間がかかったような気がする。Geminiは回答できない。Qwenが一番はやかったか。
Q(koshix):
日本の世帯の金融資産分布に関するデータが与えられています。これを近似的に再現するなるべく自然なモデル分布関数 $n=f(x)$を提案してください。 $x$は金融資産,$n$は世帯数を表します。
資産区分 ∫ f(x) dx ∫ x f(x) dx
(1) 0.0<x<0.3 4425 711
(2) 0.3<x<0.5 576.5 282
(3) 0.5<x<1.0 403.9 333
(4) 1.0<x<5.0 153.5 334
(5) 5.0<x<1000 11.8 135
A(Claude):
(前略)
このデータは二つの異なる「力学」の重ね合わせとして読めます。 第一に、下位約79%、すなわち累積で $x < 0.3$、すなわち300万円未満の世帯が、おおよそ165万円、中央値を中心とする一つのコブに収まっている。 これは、資産が乗算的な確率過程、つまり各期に一定割合ずつ増減する Gibrat 法則で形成されるときに現れる、対数正規分布の典型的な姿です。
第二に、上位の裾は対数正規よりもはるかに重い。 実際、最上位ビンの条件付き平均 1.14億円から逆算すると、密度は $f(x) \propto x^{-\alpha - 1}$ で $\alpha \simeq 1.72$ のべき乗則になっており、これは「下限のある比例成長過程」、すなわち Kesten 過程が生む Pareto 裾の指標です。
対数正規だけでは $F(5.0) = 0.9995$ と過小評価し、実測値 $F(5.0) = 0.9979$ を再現できません。 また平均も225万円程度にしか届かず、実測の322万円を再現できません。 裾が平均を支配しているわけです。
そこで、Gibrat 的なコブ、すなわち対数正規分布と、Kesten 的な裾、すなわち Pareto 分布を重ね合わせた混合分布を提案します。
パラメータは次のとおりです。 ここで、x は億円、n は万世帯/億円、$N = 5570.7$ 万世帯、$x_U = 1000$ とします。
対数正規部分の中央値は $e^{\mu} \simeq 0.161$、すなわち約161万円です。 また、最頻値は約137万円です。 Pareto 指標 $\alpha \simeq 1.72$ が裾を、すなわち全資産1795兆円のうち平均を押し上げている部分を担います。
再現性は次のとおりです。 両モーメントを対数残差で同時フィットしています。
| ビン 千万円 |
$\int f\,dx$ 実測 |
$\int f\,dx$ モデル |
人数 誤差 |
$\int x f\,dx$ 実測 |
$\int x f\,dx$ モデル |
資産額 誤差 |
|---|---|---|---|---|---|---|
| 0.0–0.3 | 4425 | 4309 | 2.6% | 711 | 701 | −1.4% |
| 0.3–0.5 | 576.5 | 635 | +10.1% | 282 | 254 | −10.1% |
| 0.5–1.0 | 403.9 | 441 | +9.1% | 333 | 296 | −11.2% |
| 1.0–5.0 | 153.5 | 175 | +14.0% | 334 | 306 | −8.4% |
| 5.0–1000 | 11.8 | 11.6 | −1.4% | 135 | 135.5 | +0.4% |
| 合計 | 5570.7 | 5570.7 | 0.0% | 1795 | 1692 | −5.7% |
注:$x$ は億円単位、$\int f\,dx$ は万世帯、$\int x f\,dx$ は資産総額に対応する集計量です。
(後略)
0 件のコメント:
コメントを投稿