正規分布
確率統計(数学B)(教科書範囲) ★★

正規分布について扱います.連続型確率分布で代表的かつ重要な存在です.
問題は標準正規分布表を使う問題が中心です.
正規分布
二項分布で,$n=6$,$p=\dfrac{1}{3}$ のグラフをChatGPTにお願いしてみました.

続いて $n=100$,$p=\dfrac{1}{3}$ のグラフもお願いしてみました.

すると,滑らかな曲線のグラフが確認できますね.
このように,実際に二項分布で $n \to \infty$ とした極限で,正規分布の確率密度関数を導くことができます.
以下に,正規分布の確率密度関数を定義し,期待値と分散も紹介します.
正規分布

$\mu$ を実数,$\sigma$ を実数とする.連続的な値をとる確率変数を連続型確率変数という.連続型確率変数 $X$ に対して
$\boldsymbol{f(x)=\dfrac{1}{\sqrt{2\pi} \sigma}e^{-\frac{(x-\mu)^{2}}{2\sigma^{2}}}}$
とすると,$f(x)$ は確率密度関数となり,$f(x)$ を正規分布といい,$X$ は正規分布 $N(\mu,\sigma^{2})$ に従うという.
正規分布の期待値,分散
正規分布の期待値,分散
$X$ が正規分布 $N(\mu,\sigma^{2})$ に従う確率変数であるとき
$\boldsymbol{E(X)=\mu}$
$\boldsymbol{V(X)=\sigma^{2}}$
正規分布の期待値,分散の証明
まず,次章で述べる標準正規分布の期待値と分散がそれぞれ $0$ と $1$ であることを示します.確率変数 $Z$ が標準正規分布に従うとき
$\displaystyle E(Z)$
$\displaystyle =\int_{-\infty}^{\infty}z\cdot \dfrac{1}{\sqrt{2\pi}}e^{-\frac{z^{2}}{2}}\,dz$
$\displaystyle =\left[-\dfrac{1}{\sqrt{2\pi}}e^{-\frac{z^{2}}{2}}\right]_{-\infty}^{\infty}$
$\displaystyle =0$
$\displaystyle V(Z)$
$\displaystyle =E(Z^2)-\left\{E(Z)\right\}^{2}$
$\displaystyle =\int_{-\infty}^{\infty}z^{2}\cdot \dfrac{1}{\sqrt{2\pi}}e^{-\frac{z^{2}}{2}}\,dz-0^2$
$\displaystyle =\int_{-\infty}^{\infty}z\left(-\dfrac{1}{\sqrt{2\pi}}e^{-\frac{z^{2}}{2}}\right)'\,dz$
$\displaystyle =\left[z\left(-\dfrac{1}{\sqrt{2\pi}}e^{-\frac{z^{2}}{2}}\right)\right]_{-\infty}^{\infty}-\int_{-\infty}^{\infty}\left(-\dfrac{1}{\sqrt{2\pi}}e^{-\frac{z^{2}}{2}}\right)\,dz$ ←部分積分
$\displaystyle =1$
確率変数 $X$ が正規分布に従うとき
$Z=\dfrac{X-\mu}{\sigma} \ \Longleftrightarrow \ X=\sigma Z+\mu$
となるので(次章で述べる標準化の逆操作)
$\displaystyle E(X)$
$\displaystyle =\sigma E(Z)+\mu$
$\displaystyle =\mu$
$\displaystyle V(Z)$
$\displaystyle =\sigma^{2} V(Z)$
$\displaystyle =\sigma^{2}$
※ 終盤の公式は確率変数の変換をした期待値と分散で扱っています.
標準正規分布
正規分布 $N(\mu,\sigma^{2})$ において,$\mu=0$,$\sigma=1$ とした特殊なものを紹介します.
標準正規分布

正規分布 $N(\mu,\sigma^{2})$ において,$\mu=0$,$\sigma=1$ としたもの(標準化したもの)を標準正規分布といい,確率密度関数は
$\boldsymbol{f(z)=\dfrac{1}{\sqrt{2\pi}}e^{-\frac{z^{2}}{2}}}$
となる.$X$ は正規分布 $N(0,1)$ に従う.
当然,期待値と分散はそれぞれ,$\boldsymbol{E(X)=0}$,$\boldsymbol{V(X)=1}$.
※ 確率密度関数で $z$ を使ってるのは,次で紹介する標準化を意識しただけで文字は問いません.
確率密度関数になっているか
確率密度関数になっているか
置換積分で少し簡単にします.
$\displaystyle \int_{-\infty}^{\infty}\dfrac{1}{\sqrt{2\pi}}e^{-\frac{z^{2}}{2}}\,dz$
$\displaystyle =\int_{-\infty}^{\infty}\dfrac{1}{\sqrt{\pi}}e^{-t^2}\,dt$ $\left(t=\dfrac{z}{\sqrt{2}}\right)$
$\displaystyle =\dfrac{1}{\sqrt{\pi}}\int_{-\infty}^{\infty}e^{-t^2}\,dt$
つまり,$\displaystyle \int_{-\infty}^{\infty}e^{-t^2}\,dt=\sqrt{\pi}$ となることを示せばいいことになります.
これはガウス積分と呼ばれるものですが,大学1年の微積分の内容です(将来的にこちらのページの増設を検討し対応します).
標準化
標準正規分布は標準正規分布表が使えるなど扱いやすいので,正規分布を標準正規分布に変換する操作が標準化です.
標準化
$X$ が正規分布 $N(\mu,\sigma^{2})$ に従うとき
$\boldsymbol{Z=\dfrac{X-\mu}{\sigma}}$
とおくと,確率変数 $Z$ は標準正規分布 $N(0,1)$ に従う.この変換を標準化という.
標準正規分布表
標準正規分布はあらゆる場面で頻繁に登場するので,(コンピュータがある現代ではあまり必要性が感じられませんが)標準正規分布の確率(以下の定積分)を参照する標準正規分布表があります.

$\displaystyle p(u)=\int_{0}^{u}\dfrac{1}{\sqrt{2\pi}}e^{-\frac{z^{2}}{2}}\,dz$
標準正規分布表の使い方
標準正規分布表の使い方
例えば,$p(1.12)$ を参照したい場合,$1.1$ の行,$.02$ の列を参照します.以下の赤色の値で,$p(1.12)=0.3686$ です.
$p(1.124)$ などの値を出したい場合,線形補完(比例配分)という考え方で算出することが多いです.
$p(1.124)$
$=0.3686+0.4\times (0.3708-0.3686)$
$=0.36948$
例題と練習問題
例題
例題
確率変数 $Z$ が $N(0,1)$ に,確率変数 $X$ が $N(2,3^{2})$ にそれぞれ従っているとき,標準正規分布表を参照して次の確率を求めよ.
(1) $P(0\leqq Z \leqq 1.23)$
(2) $P(Z \leqq 1)$
(3) $P(1\leqq Z \leqq 2)$
(4) $P(-2\leqq X \leqq 0.5)$
講義
標準正規分布表を使う練習です.(4)では標準化 $Z=\dfrac{X-\mu}{\sigma}$ をして $Z$ の範囲に変換すれば標準正規分布表が使えます.
解答
(1)

$P(0\leqq Z \leqq 1.23)$
$\displaystyle =p(1.23)$
$=\boldsymbol{0.3907}$
(2)

$P(Z \leqq 1)$
$\displaystyle =0.5+P(0\leqq Z \leqq 1)$
$\displaystyle =0.5+p(1)$
$\displaystyle =0.5+0.3413$
$=\boldsymbol{0.8413}$
(3)

$P(1\leqq Z \leqq 2)$
$\displaystyle =P(0\leqq Z \leqq 2)-P(0\leqq Z \leqq 1)$
$\displaystyle =p(2)-p(1)$
$\displaystyle =0.4772-0.3413$
$=\boldsymbol{0.1359}$
(4)
$P(-1\leqq X \leqq 0.5)$
$=P(-3\leqq X-2 \leqq -1.5)$
$=P(-1\leqq \dfrac{X-2}{3} \leqq -0.5)$
$=P(-1\leqq Z \leqq -0.5)$
$=P(0.5\leqq Z \leqq 1)$ ( $\because$ 標準正規分布は $y$ 軸対象)
$\displaystyle =p(1)-p(0.5)$
$\displaystyle =0.3413-0.1915$
$=\boldsymbol{0.1359}$
練習問題
練習1
確率変数 $Z$ が $N(0,1)$ に,確率変数 $X$ が $N(-1,2^{2})$ にそれぞれ従っているとき,標準正規分布表を参照して次の確率を求めよ.
(1) $P(Z \geqq -1.96)$
(2) $P(-0.4\leqq X \leqq 0.64)$
練習2
ある大学の入試で,合計特点の分布が正規分布 $N(320,40^{2})$ に従っているとする.上位 $5$ %を合格者にしたい場合,合格最低点は何点か.標準正規分布表を参照して答えよ.
練習1の解答
(1)
$P(Z \geqq -1.96)$
$\displaystyle =0.5+P(-1.96\leqq Z \leqq 0)$
$\displaystyle =0.5+P(0\leqq Z \leqq 1.96)$
$\displaystyle =0.5+p(1.96)$
$\displaystyle =0.5+0.4750$
$=\boldsymbol{0.9750}$
※ $Z=1.96$ は仮説検定で,有意水準 $5$ %の両側検定でよく見かける数字です.
(2)
$P(-0.4\leqq X \leqq 0.64)$
$=P(0.6\leqq X+1 \leqq 1.64)$
$=P(0.3\leqq \dfrac{X+1}{2} \leqq 0.82)$
$=P(0.3\leqq Z \leqq 0.82)$
$\displaystyle =p(0.82)-p(0.3)$
$\displaystyle =0.2939-0.1179$
$=\boldsymbol{0.1760}$
練習2の解答
合計特点を確率変数 $X$ とすると,$\dfrac{X-320}{40}$ は標準正規分布に従う.上位 $15$ %,つまり $p(u)=0.45$ のとき,$u=1.645$.
よって
$\dfrac{X-320}{40}\geqq 1.645$
$\Longleftrightarrow \ X\geqq 320+1.645\times 40=385.8$
$\boldsymbol{386}$ 人
※ 線形補完の考え方を使いました.