独立な確率変数の期待値と分散
確率統計(数学B)(教科書範囲) ★★★
確率変数の独立と,独立な確率変数の期待値と分散について扱います.
当ページでは離散型の確率変数について扱います(連続型も同様です).
公式の証明の理解に同時分布が必要です.
確率変数の独立の定義
このページでは確率変数 $X$ と $Y$ に依存関係があるかないかを考えます.例えば大小2個のサイコロを投げたときの目をそれぞれ $X$ と $Y$ としたとき, $X$ と $Y$ に依存関係がないことはなんとなくわかります.$X$ の値が $Y$ の値に影響を及ぼさないですよね.
上記の例の場合, $X$ と $Y$ が独立であると言いますが,きちんと数式で確率変数の独立の定義をします.
確率変数の独立の定義
確率変数 $X$ と $Y$ があり,$X$ のとる任意の $a$ と,$Y$ のとる任意の $b$ において,以下が成り立つとき,$X$ と $Y$ が互いに独立であるという.
$\boldsymbol{\displaystyle P(X=a,Y=b)=P(X=a)P(Y=b)}$
数学Aで事象の独立を扱いました.上記は確率変数ですが,同様です.
独立な確率変数の積の期待値
確率変数の和の期待値は,確率変数が独立であることがが不問であるのが特徴でした.
今回は独立な確率変数に対しての積の期待値の公式を紹介します.
独立な確率変数の積の期待値
互いに独立な確率変数 $X$,$Y$ に関して以下が成り立つ.
$\boldsymbol{\displaystyle E(XY)=E(X)E(Y)}$
証明
確率変数 $X$,$Y$ の同時確率関数を
$P(X=x_{i},Y=y_{j})=p_{ij}$ ( $1\leqq i \leqq n$,$1\leqq j \leqq m$ )
として
$\displaystyle P(X=x_{i})=\sum_{j=1}^{m}p_{ij}=p_{i}$
$\displaystyle P(Y=y_{j})=\sum_{i=1}^{n}p_{ij}=q_{j}$
とする.
$X$ $Y$ | $y_1$ | $y_{2}$ | $\cdots$ | $y_{m}$ | 計 |
$x_1$ | $p_{11}$ | $p_{12}$ | $\cdots$ | $p_{1m}$ | $p_1$ |
$x_2$ | $p_{21}$ | $p_{22}$ | $\cdots$ | $p_{2m}$ | $p_2$ |
$\vdots$ | $\vdots$ | $\vdots$ | $\vdots$ | $\vdots$ | $\vdots$ |
$x_n$ | $p_{n1}$ | $p_{n2}$ | $\cdots$ | $p_{nm}$ | $p_n$ |
計 | $q_1$ | $q_2$ | $\cdots$ | $q_m$ | $1$ |
$\displaystyle E(XY)$
$\displaystyle =\sum_{i=1}^{n}\sum_{j=1}^{m}x_{i}y_{j}p_{ij}$
$\displaystyle =\sum_{i=1}^{n}\sum_{j=1}^{m}x_{i}y_{j}p_{i}q_{j}$ ( $\because$ $X$ と $Y$ は独立)
$\displaystyle =\sum_{i=1}^{n}x_{i}p_{i}\sum_{j=1}^{m}y_{j}q_{j}$
$\displaystyle =E(X)E(Y)$
積の期待値を求めるよりもそれぞれの期待値を求める方が楽ならば上の公式を利用します.
念を押しますがそれぞれの確率変数が独立でなければ使えません.
上記の公式は $n$ 変数でも成立します.$X_{1}$,$X_{2}$,$\cdots$,$X_{n}$ が独立であるとき
$\boldsymbol{E(X_{1}X_{2}\cdots X_{n})=E(X_{1})E(X_{2})\cdots E(X_{n})}$
となります.
独立な確率変数の和の分散
独立な確率変数に対しての和の分散の公式を紹介します.
独立な確率変数の和の分散
互いに独立な確率変数 $X$,$Y$ に関して以下が成り立つ.
$\boldsymbol{\displaystyle V(aX+bY)=a^{2}V(X)+b^{2}V(Y)}$
↓ $a=b=1$
$\boldsymbol{\displaystyle V(X+Y)=V(X)+V(Y)}$
証明
$\displaystyle V(aX+bY)$
$\displaystyle =E((aX+bY)^{2})-\left\{E(aX+bY)\right\}^{2}$ ←分散のもう1つの出し方
$\displaystyle =E(a^{2}X^{2}+2abXY+b^{2}Y^{2})-\left\{aE(X)+bE(Y)\right\}^{2}$
$\displaystyle =a^{2}E(X^{2})+2abE(XY)+b^{2}E(Y^{2})$
$-\left\{a^{2}E(X)^{2}+2abE(X)E(Y)+b^{2}E(Y)^{2}\right\}$ ←和の期待値
$\displaystyle =a^{2}V(X)+b^{2}V(Y)+2ab\left\{E(XY)-E(X)E(Y)\right\}$
$\displaystyle =a^{2}V(X)+b^{2}V(Y)$ ( $\because$ $X$ と $Y$ は独立)
※ 高校では範囲外になっているようですが一般の確率論では $X$,$Y$ の共分散 $\rm{Cov}(X,Y)$ という概念があり,${\rm Cov}(X,Y)=E(XY)-E(X)E(Y)$ と導くことができます.つまり,確率変数 $X$,$Y$ の独立,従属に関わらず,$V(aX+bY)=a^{2}V(X)+b^{2}V(Y)+2ab{\rm Cov}(X,Y)$ となります.
こちらも念を押しますがそれぞれの確率変数が独立でなければ使えません.
上記の公式は $n$ 変数でも成立します.$X_{1}$,$X_{2}$,$\cdots$,$X_{n}$ が独立であるとき
$\displaystyle \boldsymbol{V\left(\sum_{k=1}^{n}a_{k}X_{k}\right)=\sum_{k=1}^{n}a_{k}^{2}V(X_{k})}$
となります.
例題と練習問題
例題
例題
大小 $2$ 個のサイコロを同時に投げるとき,それぞれのサイコロの出る目を $X$,$Y$ とする.
(1) $E(XY)$ を求めよ.
(2) $V(2X+Y)$ を求めよ.
講義
同時分布を書いて期待値を出さなくても,周辺分布から $E(X)$ を出せば十分です.上の公式を利用します.
解答
(1)
$P(X=k,Y=l)=P(X=k)P(Y=l)$ ( $k=1,2,\cdots,6$,$l=1,2,\cdots,6$ )より,$X$ と $Y$ は独立.
$E(X)$
$\displaystyle =(1+2+3+4+5+6)\dfrac{1}{4}$
$=\dfrac{7}{2}$
$E(XY)$
$\displaystyle =E(X)E(Y)$ ( $\because$ $X$ と $Y$ は独立)
$=\boldsymbol{\dfrac{49}{4}}$ ( $\because$ $E(X)=E(Y)$ )
(2)
$V(X)$
$=E(X^2)-\left\{E(X)\right\}^{2}$
$\displaystyle =\sum_{k=1}^{6}k^{2}P(X=k)-\left(\dfrac{7}{2}\right)^2$
$\displaystyle =\dfrac{1}{6}\sum_{k=1}^{6}k^{2}-\dfrac{49}{4}$
$\displaystyle =\dfrac{1}{6}\cdot\dfrac{1}{6}\cdot6\cdot7\cdot 13$ ←Σ公式
$=\dfrac{35}{12}$
$V(2X+Y)$
$\displaystyle =4V(X)+V(Y)$ ( $\because$ $X$ と $Y$ は独立)
$\displaystyle =5V(X)$ ( $V(X)=V(Y)$ )
$=\boldsymbol{\dfrac{175}{12}}$
練習問題
練習1
$11$,$12$,$21$,$32$ と書いた $4$ 枚のカードがある.これらをよく切って $1$ 枚を取り出すとき,十の位の数字を $X$,一の位の数字を $Y$ とする.$X$ と $Y$ は独立か従属か調べよ.
練習2
1枚の硬貨を5回投げたときの表が出る回数の分散を求めよ.
練習3
2枚の硬貨を $n$ 回投げる.$k$ 回目 $(k \leqq n)$ に表の出た枚数を $X_{k}$ とし,確率変数 $Z$ を $Z=X_{1}\cdot X_{2}\cdots X_{n}$ で定める.
(1) $Z =2^{m}$ ( $m=0, 1, 2, \cdots, n$ )となる確率を求めよ.
(2) $Z$ の期待値を求めよ.
練習1の解答
$X$ $Y$ | $1$ | $2$ | 計 |
$1$ | $\dfrac{1}{4}$ | $\dfrac{1}{4}$ | $\dfrac{1}{2}$ |
$2$ | $\dfrac{1}{4}$ | $0$ | $\dfrac{1}{4}$ |
$3$ | $0$ | $\dfrac{1}{4}$ | $\dfrac{1}{4}$ |
計 | $\dfrac{1}{2}$ | $\dfrac{1}{2}$ | $1$ |
任意の $X$,$Y$ の実現値 $a$,$b$ に対して $P(X=a,Y=b)=P(X=a)P(Y=b)$ が成立しないので,$X$ と $Y$ は従属.
練習2の解答
$k$ 回目( $1\leqq k \leqq5$ )で表が出れば $X_{k}=1$,裏が出れば $X_{k}=0$ とすると,$E(X_{k})=1\cdot\dfrac{1}{2}+0\cdot\dfrac{1}{2}=\dfrac{1}{2}$ より,求める期待値は
$E(X_{k})=E(X_{k}^{2})=1\cdot\dfrac{1}{2}+0\cdot\dfrac{1}{2}=\dfrac{1}{2}$
より
$V(X_{k})=E(X_{k}^{2})-\left\{E(X_{k})\right\}^{2}=\dfrac{1}{4}$
$V(X_{1}+X_{2}+X_{3}+X_{4}+X_{5})$
$=5V(X_{k})$ ( $\because \ X_{1}$,$X_{2}$,$\cdots$,$X_{5}$ は独立)
$=\boldsymbol{\dfrac{5}{4}}$
※ 分散と標準偏差(離散型確率変数)の練習問題,二項分布の例題と同一です.
練習3の解答 出典:1991弘前大
(1)
$P(X_{k}=2)=\dfrac{1}{4}$,$P(X_{k}=1)=\dfrac{2}{4}$,$P(X_{k}=0)=\dfrac{1}{4}$ より
$P(Z=2^{m})$
$=P(X_{1}X_{2}\cdots X_{n}=2^{m})$
$=\hspace{-0.5mm} _{n}{\rm C}_{m}\left(\dfrac{1}{4}\right)^{m}\left(\dfrac{2}{4}\right)^{n-m}$
$=\hspace{-0.5mm} _{n}{\rm C}_{m}\dfrac{2^{n-m}}{2^{2n}}$
$=\boldsymbol{\dfrac{\hspace{-0.5mm} _{n}{\rm C}_{m}}{2^{n+m}}}$
(2)
$E(X_{k})=1\cdot\dfrac{2}{4}+2\cdot\dfrac{1}{4}=1$ より
$E(Z)$
$=E(X_{1}X_{2}\cdots X_{n})$
$=E(X_{1})E(X_{2})\cdots E(X_{n})$ ( $\because \ X_{1}$,$X_{2}$,$\cdots$,$X_{n}$ は独立)
$=\boldsymbol{1}$
※ 誘導に乗って,期待値を定義通りに,$\displaystyle E(Z)=\sum_{m=0}^{n}2^{m}\cdot \dfrac{\hspace{-0.5mm} _{n}{\rm C}_{m}}{2^{n+m}}$ で求めようとすると,二項定理が必要です.