2026年6月21日日曜日

Claude 4.7 Opus

Claude 3.7 Sonnet からの続き
 

図:日本の世帯金融資産分布(野村総研より引用)

図の資料が日本経済新聞のマネーのまなび欄にでていた。見たことがあるなと思いつつ,このデータを再現する簡単な分布関数 $n=f(x)$ (nは世帯数,xは金融資産値)を探してもらった。単調減少関数という条件を付けると,世帯数を再現するものは簡単に見つかったのだが,各区分の金融資産の積分値が一致しない。 

以前の経験をすっかり忘れていた。低中所得層は対数正規分布で,高所得層はパレート分布(べき分布)にするのだった。今回,ChatGPT,Claude,Deepseek,Qwenなどにきいたが,いずれも以前より時間がかかったような気がする。Geminiは回答できない。Qwenが一番はやかったか。 

Q(koshix):
日本の世帯の金融資産分布に関するデータが与えられています。これを近似的に再現するなるべく自然なモデル分布関数 $n=f(x)$を提案してください。 $x$は金融資産,$n$は世帯数を表します。
 資産区分  ∫ f(x) dx      ∫ x f(x) dx
(1) 0.0<x<0.3  4425  711
(2) 0.3<x<0.5  576.5  282
(3) 0.5<x<1.0  403.9  333
(4) 1.0<x<5.0  153.5  334
(5) 5.0<x<1000  11.8  135

A(Claude):
(前略)

このデータは二つの異なる「力学」の重ね合わせとして読めます。 第一に、下位約79%、すなわち累積で $x < 0.3$、すなわち300万円未満の世帯が、おおよそ165万円、中央値を中心とする一つのコブに収まっている。 これは、資産が乗算的な確率過程、つまり各期に一定割合ずつ増減する Gibrat 法則で形成されるときに現れる、対数正規分布の典型的な姿です。

第二に、上位の裾は対数正規よりもはるかに重い。 実際、最上位ビンの条件付き平均 1.14億円から逆算すると、密度は $f(x) \propto x^{-\alpha - 1}$ で $\alpha \simeq 1.72$ のべき乗則になっており、これは「下限のある比例成長過程」、すなわち Kesten 過程が生む Pareto 裾の指標です。

対数正規だけでは $F(5.0) = 0.9995$ と過小評価し、実測値 $F(5.0) = 0.9979$ を再現できません。 また平均も225万円程度にしか届かず、実測の322万円を再現できません。 裾が平均を支配しているわけです。

そこで、Gibrat 的なコブ、すなわち対数正規分布と、Kesten 的な裾、すなわち Pareto 分布を重ね合わせた混合分布を提案します。

$ n = f(x) = N \left[ (1-w) \underbrace{ \frac{1}{x \sigma \sqrt{2\pi}} \exp\left\{ -\frac{(\ln x - \mu)^2}{2\sigma^2} \right\} }_{\text{対数正規、コブ}} + w \underbrace{ \frac{ \alpha x_m^{\alpha} x^{-\alpha-1} }{ 1 - (x_U/x_m)^{-\alpha} } }_{\text{Pareto、裾、} x_m \le x \le x_U} \right] $

パラメータは次のとおりです。 ここで、x は億円n は万世帯/億円、$N = 5570.7$ 万世帯、$x_U = 1000$ とします。

$$ \mu = -1.825,\qquad \sigma = 0.40,\qquad x_m = 0.381,\qquad \alpha = 1.724,\qquad w = 0.177 $$

対数正規部分の中央値は $e^{\mu} \simeq 0.161$、すなわち約161万円です。 また、最頻値は約137万円です。 Pareto 指標 $\alpha \simeq 1.72$ が裾を、すなわち全資産1795兆円のうち平均を押し上げている部分を担います。

再現性は次のとおりです。 両モーメントを対数残差で同時フィットしています。

ビン
千万円
$\int f\,dx$
実測
$\int f\,dx$
モデル
人数
誤差
$\int x f\,dx$
実測
$\int x f\,dx$
モデル
資産額
誤差
0.0–0.3 4425 4309 2.6% 711 701 −1.4%
0.3–0.5 576.5 635 +10.1% 282 254 −10.1%
0.5–1.0 403.9 441 +9.1% 333 296 −11.2%
1.0–5.0 153.5 175 +14.0% 334 306 −8.4%
5.0–1000 11.8 11.6 −1.4% 135 135.5 +0.4%
合計 5570.7 5570.7 0.0% 1795 1692 −5.7%

注:$x$ は億円単位、$\int f\,dx$ は万世帯、$\int x f\,dx$ は資産総額に対応する集計量です。


(後略)

0 件のコメント: