おいしい数学HOMEへのリンク

正規分布

確率統計(数学B)(教科書範囲) ★★

アイキャッチ

正規分布について扱います.連続型確率分布で代表的かつ重要な存在です.

問題は標準正規分布表を使う問題が中心です.

正規分布

二項分布で,$n=6$,$p=\dfrac{1}{3}$ のグラフをChatGPTにお願いしてみました.

正規分布gpt1

続いて $n=100$,$p=\dfrac{1}{3}$ のグラフもお願いしてみました.

正規分布gpt2

すると,滑らかな曲線のグラフが確認できますね.

このように,実際に二項分布で $n \to \infty$ とした極限で,正規分布の確率密度関数を導くことができます.

以下に,正規分布の確率密度関数を定義し,期待値と分散も紹介します.

正規分布

正規分布

$\mu$ を実数,$\sigma$ を実数とする.連続的な値をとる確率変数を連続型確率変数という.連続型確率変数 $X$ に対して

$\boldsymbol{f(x)=\dfrac{1}{\sqrt{2\pi} \sigma}e^{-\frac{(x-\mu)^{2}}{2\sigma^{2}}}}$

とすると,$f(x)$ は確率密度関数となり,$f(x)$ を正規分布といい,$X$ は正規分布 $N(\mu,\sigma^{2})$ に従うという.

正規分布の期待値,分散

正規分布の期待値,分散

$X$ が正規分布 $N(\mu,\sigma^{2})$ に従う確率変数であるとき

$\boldsymbol{E(X)=\mu}$

$\boldsymbol{V(X)=\sigma^{2}}$

正規分布の期待値,分散の証明

まず,次章で述べる標準正規分布の期待値と分散がそれぞれ $0$ と $1$ であることを示します.確率変数 $Z$ が標準正規分布に従うとき

 $\displaystyle E(Z)$

$\displaystyle =\int_{-\infty}^{\infty}z\cdot \dfrac{1}{\sqrt{2\pi}}e^{-\frac{z^{2}}{2}}\,dz$

$\displaystyle =\left[-\dfrac{1}{\sqrt{2\pi}}e^{-\frac{z^{2}}{2}}\right]_{-\infty}^{\infty}$

$\displaystyle =0$

 $\displaystyle V(Z)$

$\displaystyle =E(Z^2)-\left\{E(Z)\right\}^{2}$

$\displaystyle =\int_{-\infty}^{\infty}z^{2}\cdot \dfrac{1}{\sqrt{2\pi}}e^{-\frac{z^{2}}{2}}\,dz-0^2$

$\displaystyle =\int_{-\infty}^{\infty}z\left(-\dfrac{1}{\sqrt{2\pi}}e^{-\frac{z^{2}}{2}}\right)'\,dz$

$\displaystyle =\left[z\left(-\dfrac{1}{\sqrt{2\pi}}e^{-\frac{z^{2}}{2}}\right)\right]_{-\infty}^{\infty}-\int_{-\infty}^{\infty}\left(-\dfrac{1}{\sqrt{2\pi}}e^{-\frac{z^{2}}{2}}\right)\,dz$ ←部分積分

$\displaystyle =1$

確率変数 $X$ が正規分布に従うとき

$Z=\dfrac{X-\mu}{\sigma} \ \Longleftrightarrow \ X=\sigma Z+\mu$

となるので(次章で述べる標準化の逆操作)

 $\displaystyle E(X)$

$\displaystyle =\sigma E(Z)+\mu$

$\displaystyle =\mu$

 $\displaystyle V(Z)$

$\displaystyle =\sigma^{2} V(Z)$

$\displaystyle =\sigma^{2}$

※ 終盤の公式は確率変数の変換をした期待値と分散で扱っています.

標準正規分布

正規分布 $N(\mu,\sigma^{2})$ において,$\mu=0$,$\sigma=1$ とした特殊なものを紹介します.

標準正規分布

標準正規分布

正規分布 $N(\mu,\sigma^{2})$ において,$\mu=0$,$\sigma=1$ としたもの(標準化したもの)を標準正規分布といい,確率密度関数

$\boldsymbol{f(z)=\dfrac{1}{\sqrt{2\pi}}e^{-\frac{z^{2}}{2}}}$

となる.$X$ は正規分布 $N(0,1)$ に従う.

当然,期待値と分散はそれぞれ,$\boldsymbol{E(X)=0}$$\boldsymbol{V(X)=1}$

※ 確率密度関数で $z$ を使ってるのは,次で紹介する標準化を意識しただけで文字は問いません.

確率密度関数になっているか

確率密度関数になっているか

置換積分で少し簡単にします.

 $\displaystyle \int_{-\infty}^{\infty}\dfrac{1}{\sqrt{2\pi}}e^{-\frac{z^{2}}{2}}\,dz$

$\displaystyle =\int_{-\infty}^{\infty}\dfrac{1}{\sqrt{\pi}}e^{-t^2}\,dt$ $\left(t=\dfrac{z}{\sqrt{2}}\right)$

$\displaystyle =\dfrac{1}{\sqrt{\pi}}\int_{-\infty}^{\infty}e^{-t^2}\,dt$

つまり,$\displaystyle \int_{-\infty}^{\infty}e^{-t^2}\,dt=\sqrt{\pi}$ となることを示せばいいことになります.

これはガウス積分と呼ばれるものですが,大学1年の微積分の内容です(将来的にこちらのページの増設を検討し対応します).

標準化

標準正規分布は標準正規分布表が使えるなど扱いやすいので,正規分布を標準正規分布に変換する操作が標準化です.

標準化

$X$ が正規分布 $N(\mu,\sigma^{2})$ に従うとき

$\boldsymbol{Z=\dfrac{X-\mu}{\sigma}}$

とおくと,確率変数 $Z$ は標準正規分布 $N(0,1)$ に従う.この変換を標準化という.

標準正規分布表

標準正規分布はあらゆる場面で頻繁に登場するので,(コンピュータがある現代ではあまり必要性が感じられませんが)標準正規分布の確率(以下の定積分)を参照する標準正規分布表があります.

標準正規分布表

$\displaystyle p(u)=\int_{0}^{u}\dfrac{1}{\sqrt{2\pi}}e^{-\frac{z^{2}}{2}}\,dz$

標準正規分布表の使い方

標準正規分布表の使い方

例えば,$p(1.12)$ を参照したい場合,$1.1$ の行,$.02$ の列を参照します.以下の赤色の値で,$p(1.12)=0.3686$ です.

$p(1.124)$ などの値を出したい場合,線形補完(比例配分)という考え方で算出することが多いです.

 $p(1.124)$

$=0.3686+0.4\times (0.3708-0.3686)$

$=0.36948$

例題と練習問題

例題

例題

確率変数 $Z$ が $N(0,1)$ に,確率変数 $X$ が $N(2,3^{2})$ にそれぞれ従っているとき,標準正規分布表を参照して次の確率を求めよ.

(1) $P(0\leqq Z \leqq 1.23)$

(2) $P(Z \leqq 1)$

(3) $P(1\leqq Z \leqq 2)$

(4) $P(-2\leqq X \leqq 0.5)$


講義

標準正規分布表を使う練習です.(4)では標準化 $Z=\dfrac{X-\mu}{\sigma}$ をして $Z$ の範囲に変換すれば標準正規分布表が使えます.


解答

(1)

例題の図1

 $P(0\leqq Z \leqq 1.23)$

$\displaystyle =p(1.23)$

$=\boldsymbol{0.3907}$


(2)

例題の図2

 $P(Z \leqq 1)$

$\displaystyle =0.5+P(0\leqq Z \leqq 1)$

$\displaystyle =0.5+p(1)$

$\displaystyle =0.5+0.3413$

$=\boldsymbol{0.8413}$


(3)

例題の図3

 $P(1\leqq Z \leqq 2)$

$\displaystyle =P(0\leqq Z \leqq 2)-P(0\leqq Z \leqq 1)$

$\displaystyle =p(2)-p(1)$

$\displaystyle =0.4772-0.3413$

$=\boldsymbol{0.1359}$


(4)

 $P(-1\leqq X \leqq 0.5)$

$=P(-3\leqq X-2 \leqq -1.5)$

$=P(-1\leqq \dfrac{X-2}{3} \leqq -0.5)$

$=P(-1\leqq Z \leqq -0.5)$

$=P(0.5\leqq Z \leqq 1)$ ( $\because$ 標準正規分布は $y$ 軸対象)

$\displaystyle =p(1)-p(0.5)$

$\displaystyle =0.3413-0.1915$

$=\boldsymbol{0.1359}$

練習問題

練習1

確率変数 $Z$ が $N(0,1)$ に,確率変数 $X$ が $N(-1,2^{2})$ にそれぞれ従っているとき,標準正規分布表を参照して次の確率を求めよ.

(1) $P(Z \geqq -1.96)$

(2) $P(-0.4\leqq X \leqq 0.64)$


練習2

ある大学の入試で,合計特点の分布が正規分布 $N(320,40^{2})$ に従っているとする.上位 $5$ %を合格者にしたい場合,合格最低点は何点か.標準正規分布表を参照して答えよ.

練習1の解答

(1)

 $P(Z \geqq -1.96)$

$\displaystyle =0.5+P(-1.96\leqq Z \leqq 0)$

$\displaystyle =0.5+P(0\leqq Z \leqq 1.96)$

$\displaystyle =0.5+p(1.96)$

$\displaystyle =0.5+0.4750$

$=\boldsymbol{0.9750}$

※ $Z=1.96$ は仮説検定で,有意水準 $5$ %の両側検定でよく見かける数字です.


(2)

 $P(-0.4\leqq X \leqq 0.64)$

$=P(0.6\leqq X+1 \leqq 1.64)$

$=P(0.3\leqq \dfrac{X+1}{2} \leqq 0.82)$

$=P(0.3\leqq Z \leqq 0.82)$

$\displaystyle =p(0.82)-p(0.3)$

$\displaystyle =0.2939-0.1179$

$=\boldsymbol{0.1760}$


練習2の解答

合計特点を確率変数 $X$ とすると,$\dfrac{X-320}{40}$ は標準正規分布に従う.上位 $15$ %,つまり $p(u)=0.45$ のとき,$u=1.645$.

よって

 $\dfrac{X-320}{40}\geqq 1.645$

$\Longleftrightarrow \ X\geqq 320+1.645\times 40=385.8$

$\boldsymbol{386}$ 人

※ 線形補完の考え方を使いました.