二項分布
確率統計(数学B)(教科書範囲) ★★

二項分布
数学Aの反復試行の確率では,繰り返し行う独立な試行の確率を考えました.
この反復試行の確率で表現される確率分布を二項分布(binomial distribution)といいます.
二項分布
独立試行において,1回の試行で事象 $A$ が起こる確率を $p$ とする.この試行を $n$ 回繰り返し行うとき,事象 $A$ がちょうど $k$ 回起こる確率
$\boldsymbol{P(X=k)=\hspace{-0.5mm} _{n}{\rm C}_{k} p^{k}(1-p)^{n-k}}$
で表現される確率分布を二項分布といい,$\boldsymbol{B(n,p)}$ で表す.
補足
すべての確率の和は $1$
上の確率では,$k=0,1,\cdots,n$ の値を取りますが,二項定理によればこれらの和が $1$ になることを確認できます.
$\displaystyle \ \sum_{k=0}^{n}\hspace{-0.5mm} _{n}{\rm C}_{k} p^{k}(1-p)^{n-k}$
$=\{p+(1-p)\}^n$
$=1$
今後,正規分布やポアソン分布等,一般には様々な種類の確率分布が登場しますが,二項分布は基礎的なものであり今後のために重要です.
二項分布の期待値と分散
二項分布の期待値と分散の求め方
Ⅰが簡単なので万人にオススメです.Ⅰの概念(和の期待値,独立な確率変数の和の分散)が未習の場合等,Ⅱの直接求める方法も大切です.Ⅲは興味がある方向け,Ⅳは大学範囲です.
今回は以下でⅠとⅡを言及します.
二項分布の期待値
二項分布の期待値
確率変数 $X$ が 二項分布 $B(n,p)$ に従うとき
$\boldsymbol{\displaystyle E(X)=np}$
Ⅰでの証明
$k$ 回目( $1\leqq k \leqq n$ )で表が出れば $X_{k}=1$,裏が出れば $X_{k}=0$ とすると,$E(X_{k})=1\cdot p+0\cdot(1-p)=p$ より,求める期待値は
$E(X)$
$=E(X_{1}+X_{2}+\cdots+X_{n})$
$=E(X_{1})+E(X_{2})+\cdots+E(X_{n})$ ←和の期待値
$=np$
直接求める方法
Ⅱでの証明(直接求める方法)
$E(X)$
$\displaystyle =\sum_{k=0}^{n}k\cdot \hspace{-0.5mm} _{n}{\rm C}_{k} p^{k}(1-p)^{n-k}$
$\displaystyle =\sum_{k=1}^{n}k\cdot \hspace{-0.5mm} _{n}{\rm C}_{k} p^{k}(1-p)^{n-k}$
$\displaystyle =\sum_{k=1}^{n}\dfrac{n!}{(k-1)!(n-k)!}p^{k}(1-p)^{n-k}$
$\displaystyle =np\sum_{k=1}^{n}\dfrac{(n-1)!}{(k-1)!(n-k)!}p^{k-1}(1-p)^{n-k}$
$\displaystyle =np\sum_{k=1}^{n}\hspace{-0.5mm} _{n-1}{\rm C}_{k-1}p^{k-1}(1-p)^{n-k}$
$=np$
以下,分散の変換しない方法はさらにテクニカルです.
二項分布の分散
二項分布の分散
確率変数 $X$ が 二項分布 $B(n,p)$ に従うとき
$\boldsymbol{\displaystyle V(X)=np(1-p)}$
Ⅰでの証明
$k$ 回目( $1\leqq k \leqq n$ )で表が出れば $X_{k}=1$,裏が出れば $X_{k}=0$ とすると,$E(X_{k})=E(X_{k}^{2})=1\cdot p+0\cdot(1-p)=p$ より,$V(X_{k})=E(X_{k}^{2})-\left\{E(X_{k})\right\}^{2}=p(1-p)$.
$V(X)$
$=V(X_{1}+X_{2}+\cdots+X_{n})$
$=V(X_{1})+V(X_{2})+\cdots+V(X_{n})$ ( $\because \ X_{1}$,$X_{2}$,$\cdots$,$X_{n}$ は独立) ←独立な確率変数の分散
$=np(1-p)$
直接求める方法
Ⅱでの証明(直接求める方法)
$V(X)$
$=E(X^{2})-\left\{E(X)\right\}^{2}$
$\displaystyle =\sum_{k=0}^{n}k^{2}\cdot \hspace{-0.5mm} _{n}{\rm C}_{k} p^{k}(1-p)^{n-k}-(np)^2$
$\displaystyle =\sum_{k=1}^{n}k^{2}\cdot \hspace{-0.5mm} _{n}{\rm C}_{k} p^{k}(1-p)^{n-k}-n^{2}p^{2}$
$\displaystyle =\sum_{k=1}^{n}\{k(k-1)\cdot \hspace{-0.5mm} _{n}{\rm C}_{k} p^{k}(1-p)^{n-k}+k\cdot \hspace{-0.5mm} _{n}{\rm C}_{k} p^{k}(1-p)^{n-k}\}-n^{2}p^{2}$
$\displaystyle =\sum_{k=2}^{n}k(k-1)\cdot \hspace{-0.5mm} _{n}{\rm C}_{k} p^{k}(1-p)^{n-k}+E(X)-n^{2}p^{2}$
$\displaystyle =\sum_{k=2}^{n}\dfrac{n!}{(k-2)!(n-k)!}p^{k}(1-p)^{n-k}+np-n^{2}p^{2}$
$\displaystyle =n(n-1)p^{2}\sum_{k=1}^{n}\dfrac{(n-2)!}{(k-1)!(n-k)!}p^{k-2}(1-p)^{n-k}+np-n^{2}p^{2}$
$\displaystyle =n(n-1)p^{2}+np-n^{2}p^{2}$
$=np(1-p)$
例題と練習問題
例題
例題
1枚の硬貨を5回投げたときの表が出る回数の期待値と分散を求めよ.
講義
今までに,期待値,確率変数の和の期待値,独立な確率変数の分散でも練習問題で扱ってきた話題ですが,二項分布であることを見抜けば,上の公式を利用すれば楽です.
解答
表の出る回数は二項分布 $B\left(5,\dfrac{1}{2}\right)$ に従うので
$E(X)=5\cdot \dfrac{1}{2}=\boldsymbol{\dfrac{5}{2}}$
$V(X)=5\cdot \dfrac{1}{2}\cdot \dfrac{1}{2}=\boldsymbol{\dfrac{5}{4}}$
練習問題
練習
袋の中に赤球が $4$ 個,白球が $6$ 個入っている.$1$ 個取り出し,色を調べてから袋に戻す.これを $100$ 回繰り返すとき,取り出す赤球の個数 $X$ の期待値と標準偏差を求めよ.
練習の解答
$X$ は二項分布 $B\left(100,\dfrac{2}{5}\right)$ に従うので
$E(X)=100\cdot \dfrac{2}{5}=\boldsymbol{40}$
$V(X)=100\cdot \dfrac{3}{5}\cdot \dfrac{2}{5}=24$
$\sigma (X)=\sqrt{V(X)}=\boldsymbol{2\sqrt{6}}$