2023年5月27日土曜日

出生時の体重分布

赤ちゃんの出生時の体重分布がないのか調べてみた。500gきざみはすぐ見つかったのだが,もう少し精度がないかと探したところ,統計でみる日本 e-Stat にあった。人口動態調査 人口動態統計 確定数 保管統計表 出生 / 出生数,性・出生時の体重(100g階級)・出生時の身長別 というものだ。

これをExcelでグラフにするが,普通の正規分布と比較しやすくするため,縦軸の100g区間ごとの出生数を全体の出生数に対する割合(%)に直した。なお,これは2021年(最新)のデータであり,男子の(出生数,平均値,標準偏差)は(415,836人,3.047 kg,0.390 kg),女子のそれは(395,687人,2.962 kg,0.358 kg)となっている。


図1:女子(青)と男子(オレンジ)の出生数割合(横軸100gビン数)

正規分布の方は,Mathematicaの組み込み関数を使うのだけれど,100g刻みにしているデータと比較するため,μを10倍,σを10倍にしたものを使っている。
In[1]:= f[\[Mu]_, \[Sigma]_] := 
 Integrate[ Exp[-(x - \[Mu])^2/(2*\[Sigma]^2)]/
  Sqrt[2*Pi*\[Sigma]^2], {x, -Infinity, Infinity}]

In[2]:= f[29.62, 3.58]
Out[2]= 1. - 8.59978*10^-15 I

In[3]:= g[\[Mu]_, \[Sigma]_] := 
 Plot[Exp[-(x - \[Mu])^2/(2*\[Sigma]^2)]/Sqrt[2*Pi*\[Sigma]^2],
 {x, 0, 20 \[Sigma]}, PlotRange -> {0, .12}]

In[4]:= g1 = g[29.62, 3.58];
In[5]:= g2 = g[30.47, 3.90];
In[6]:= Show[g1, g2]
Out[6]= -Graphics-

In[7]:= Plot[
 {PDF[NormalDistribution[29.62, 3.58], x] // Evaluate, 
  PDF[NormalDistribution[30.47, 3.90], x] // Evaluate},
 {x, 0, 50}, Filling -> Axis, PlotRange -> {0, 0.13}]
Out[7]= -Graphics-
ほぼそれらしいような気もするが,微妙に正規分布からずれているのかもしれない。例えば,青の4 kg の位置では累積割合で 99.5% になる。この位置は正規分布では,2.86σ相当に対応する。それで積分すると99.8%になってしまうので,少しずれているようだ。


図2:平均値と標準偏差をそろえた正規分布

0 件のコメント: