おいしい数学HOMEへのリンク

分散と標準偏差(離散型確率変数)

確率統計(数学B)(教科書範囲) ★★

アイキャッチ

数学Bの確率分布と統計的推測や一般の確率論で扱う,(離散型の確率変数の)分散と標準偏差について扱います.

あらゆる側面で数学Ⅰのデータの分析や統計学の分散と標準偏差と似ています.

分散と標準偏差(離散型確率変数)

分散

あなたが女性だとして結婚相手を選ぶ際,以下の2人から選ばなければならないとします.

A:毎年100%の確率で年収が500万円の公務員

B:毎年50%の確率で年収が1000万円になり,50%の確率で年収が0円になる芸人

どちらも年収の期待値は500万円ですが,芸人の方がばらつきがあることがわかります.どちらを選ぶのがいいでしょうか?

確率によって変動する数値のばらつきを表す客観的な指標が分散になります.

分散

確率変数 $X$ の期待値を $E(X)=\mu$ とすると,確率変数 $X$ の分散 $V(X)$ を

$\begin{align}\boldsymbol{V(X)}&\boldsymbol{\displaystyle =E\left(\left(X-\mu\right)^{2}\right)} \\ &\boldsymbol{=\sum_{k=1}^{n}(x_{k}-\mu)^{2}p_{k}}\end{align}$

で定義する.

※ $\mu$ はミューと読みます.


式の考え方はデータの分析や統計学の分散と同じです.

この定義で先程の結婚相手の分散をそれぞれ出すと

(Aの分散) $=0$

(Bの分散) $=(1000-500)^{2}\dfrac{1}{2}+(0-500)^{2}\dfrac{1}{2}=500^{2}$

となり,Bの方が散らばりが大きいことがわかります(金融工学的には期待値を大きく,分散を小さく選択するのが好ましいです).

既にあるデータから平均や分散を出し結論を出すのが統計学で,未来の不確定な事象に対して期待値や分散を使って判断するのが確率論です.確率と統計は兄弟のようですが,考え方が少し違いますね.

標準偏差

数学Ⅰのデータの分析や統計学の標準偏差と同じように,確率変数にも同じ理由で標準偏差が存在します.

標準偏差

確率変数 $X$ の標準偏差 $\sigma(X)$ を

$\boldsymbol{\sigma(X)=\sqrt{V(X)}}$

で定義する.

※ $\sigma$ はギリシャ文字のsでシグマと読みます.

分散のもう1つの出し方

分散に関する定理

確率変数 $X$ の分散 $V(X)$ に関して

$\boldsymbol{\displaystyle V(X)=E(X^2)-\left\{E(X)\right\}^{2}}$

が成り立つ.


証明

 $\displaystyle V(X)$

$\displaystyle =\sum_{k=1}^{n}(x_{k}-\mu)^{2}p_{k} (\mu=E(X))$

$\displaystyle =\sum_{k=1}^{n}(x_{k}^{2}p_{k}-2\mu x_{k}p_{k}+\mu^{2}p_{k})$

$\displaystyle =\sum_{k=1}^{n}x_{k}^{2}p_{k}-2\mu \sum_{k=1}^{n}x_{k}p_{k}+\mu^{2}\sum_{k=1}^{n}p_{k}$

$\displaystyle =E(X^2)-2\left\{E(X)\right\}^{2}+\left\{E(X)\right\}^{2}$

$\displaystyle =E(X^2)-\left\{E(X)\right\}^{2}$


証明はデータの分析や統計学の分散のもう1つの出し方と同様です.

期待値が分数になることが多く分散を定義で計算すると煩雑なので,上の公式の出番は多いです.

例題と練習問題

例題

例題

白球 $5$ 個,黒球 $2$ 個が入っている袋から,同時に $4$ 個を取り出し,その中に含まれる白球の個数を $X$ とする.

(1) $X$ の平均値(期待値)を求めよ.

(2) $X$ の分散を求めよ.

(2017 昭和大医学部)


講義

仮に分散だけ問われていても期待値を求めます.必要なら確率分布表を書くといいと思います.


解答

(1) 取り出す赤球の個数を $X$ とすると

 $P(X=2)$

$=\dfrac{_{5}{\rm C}_{2} \cdot \ _{2}{\rm C}_{2}}{_{7}{\rm C}_{4}}$

$=\dfrac{10}{35}$


 $P(X=3)$

$=\dfrac{_{5}{\rm C}_{3} \cdot \ _{2}{\rm C}_{1}}{_{7}{\rm C}_{4}}$

$=\dfrac{20}{35}$


 $P(X=4)$

$=\dfrac{_{5}{\rm C}_{4}}{_{7}{\rm C}_{4}}$

$=\dfrac{5}{35}$


 $E(X)$

$=2\cdot P(X=2)+3\cdot P(X=3)+4\cdot P(X=4)$

$=\dfrac{20+60+20}{35}$

$=\boldsymbol{\dfrac{20}{7}}$

※ 大学の統計学の内容の超幾何分布に従うので,その公式を知っていると答えのみならば $E(X)=4\cdot\dfrac{5}{7}=\boldsymbol{\dfrac{20}{7}}$ で速いです.


(2)

 $V(X)$

$=E(X^2)-\left\{E(X)\right\}^{2}$

$=2^{2}\cdot P(X=2)+3^{2}\cdot P(X=3)+4^{2}\cdot P(X=4)-\left(\dfrac{20}{7}\right)^2$

$=\boldsymbol{\dfrac{20}{49}}$

※ 確率変数の分散は定義に従って求めると大変なことが多く,もう1つの出し方で求めることが多いです.

※ 同じく超幾何分布の公式を知っていると答えのみならば $V(X)=4\cdot\dfrac{5}{7}\left(1-\dfrac{5}{7}\right)\dfrac{7-4}{7-1}=\boldsymbol{\dfrac{20}{49}}$ で速いですが,高校生は知らなくていいでしょう.

練習問題

練習

(1)サイコロを1回投げたときの出る目を $X$ としたとき,$X$ の分散と標準偏差を求めよ.

(2)1枚の硬貨を5回投げたときの表が出る回数の分散を求めよ.

練習の解答

(1)

 $E(X)$

$\displaystyle =\sum_{k=1}^{6}k\cdot P(X=k)$

$\displaystyle =\dfrac{1}{6}\sum_{k=1}^{6}k$

$\displaystyle =\dfrac{1}{6}\cdot\dfrac{1}{2}\cdot6\cdot7$ ←Σ公式

$=\dfrac{7}{2}$

 $V(X)$

$=E(X^2)-\left\{E(X)\right\}^{2}$

$\displaystyle =\sum_{k=1}^{6}k^{2}P(X=k)-\left(\dfrac{7}{2}\right)^2$

$\displaystyle =\dfrac{1}{6}\sum_{k=1}^{6}k^{2}-\dfrac{49}{4}$

$\displaystyle =\dfrac{1}{6}\cdot\dfrac{1}{6}\cdot6\cdot7\cdot 13$ ←Σ公式

$=\boldsymbol{\dfrac{35}{12}}$

 $\sigma(X)$

$=\sqrt{V(X)}$

$=\boldsymbol{\dfrac{105}{6}}$


(2)

表が出る回数を $X$ とすると

 $E(X)$

$\displaystyle =\sum_{k=0}^{5}k\cdot P(X=k)$

$\displaystyle =\sum_{k=0}^{5}k\cdot _{5}{\rm C}_{k}\left(\dfrac{1}{2}\right)^{k}\left(\dfrac{1}{2}\right)^{5-k}$

$\displaystyle =\sum_{k=1}^{5}k\cdot _{5}{\rm C}_{k}\left(\dfrac{1}{2}\right)^{5}$

$=\dfrac{1}{32}(1\times \hspace{-0.5mm} _{5}{\rm C}_{1}+2\times\hspace{-0.5mm} _{5}{\rm C}_{2}+3\times\hspace{-0.5mm} _{5}{\rm C}_{3}+4\times\hspace{-0.5mm} _{5}{\rm C}_{4}+5)$

$=\boldsymbol{\dfrac{5}{2}}$

 $V(X)$

$=E(X^2)-\left\{E(X)\right\}^{2}$

$\displaystyle =\sum_{k=1}^{5}k^{2}\cdot _{5}{\rm C}_{k}\left(\dfrac{1}{2}\right)^{5}-\left(\dfrac{5}{2}\right)^2$

$=\dfrac{1}{32}(1\times \hspace{-0.5mm} _{5}{\rm C}_{1}+4\times\hspace{-0.5mm} _{5}{\rm C}_{2}+9\times\hspace{-0.5mm} _{5}{\rm C}_{3}+16\times\hspace{-0.5mm} _{5}{\rm C}_{4}+25)-\dfrac{25}{4}$

$=\boldsymbol{\dfrac{5}{4}}$

期待値の練習問題と題材は同じです.

独立な確率変数の期待値と分散の練習問題と同一です.

※ 二項分布であることと,二項分布の期待値や分散の公式を知っていると即答できます.