これをExcelでグラフにするが,普通の正規分布と比較しやすくするため,縦軸の100g区間ごとの出生数を全体の出生数に対する割合(%)に直した。なお,これは2021年(最新)のデータであり,男子の(出生数,平均値,標準偏差)は(415,836人,3.047 kg,0.390 kg),女子のそれは(395,687人,2.962 kg,0.358 kg)となっている。
図1:女子(青)と男子(オレンジ)の出生数割合(横軸100gビン数)
正規分布の方は,Mathematicaの組み込み関数を使うのだけれど,100g刻みにしているデータと比較するため,μを10倍,σを10倍にしたものを使っている。
In[1]:= f[\[Mu]_, \[Sigma]_] :=Integrate[ Exp[-(x - \[Mu])^2/(2*\[Sigma]^2)]/Sqrt[2*Pi*\[Sigma]^2], {x, -Infinity, Infinity}]In[2]:= f[29.62, 3.58]Out[2]= 1. - 8.59978*10^-15 IIn[3]:= g[\[Mu]_, \[Sigma]_] :=Plot[Exp[-(x - \[Mu])^2/(2*\[Sigma]^2)]/Sqrt[2*Pi*\[Sigma]^2],{x, 0, 20 \[Sigma]}, PlotRange -> {0, .12}]In[4]:= g1 = g[29.62, 3.58];In[5]:= g2 = g[30.47, 3.90];In[6]:= Show[g1, g2]Out[6]= -Graphics-In[7]:= Plot[{PDF[NormalDistribution[29.62, 3.58], x] // Evaluate,PDF[NormalDistribution[30.47, 3.90], x] // Evaluate},{x, 0, 50}, Filling -> Axis, PlotRange -> {0, 0.13}]Out[7]= -Graphics-
ほぼそれらしいような気もするが,微妙に正規分布からずれているのかもしれない。例えば,青の4 kg の位置では累積割合で 99.5% になる。この位置は正規分布では,2.86σ相当に対応する。それで積分すると99.8%になってしまうので,少しずれているようだ。
図2:平均値と標準偏差をそろえた正規分布
0 件のコメント:
コメントを投稿