おいしい数学HOMEへのリンク

同時分布と周辺分布

確率統計(数学B)(教科書範囲) ★★

アイキャッチ

同時分布と周辺分布について扱います.

多次元の確率分布の話になりますが,高校数学では基本的に確率変数 $X$ と $Y$ の2次元の確率が対象です.

同時分布と周辺分布

データの分析では途中から2変量の関係(共分散と相関係数)を扱っていきました.

確率でも,これから確率変数 $X$ と $Y$ 等の2変量の関係について扱っていきます.しかし,高校の検定教科書では確率変数の共分散 ${\rm Cov}(X,Y)$ や相関係数 $\rho$ の記載はありません.

同時分布と周辺分布

2つの確率変数 $X$,$Y$ について,$P(X=x_{i},Y=y_{j})=p_{ij}$ ( $1\leqq i \leqq n$,$1\leqq j \leqq m$ )を同時確率関数という.以下のように表にすることができる.

$X$ $Y$ $y_1$ $y_{2}$ $\cdots$ $y_{m}$
$x_1$ $p_{11}$ $p_{12}$ $\cdots$ $p_{1m}$ $p_1$
$x_2$ $p_{21}$ $p_{22}$ $\cdots$ $p_{2m}$ $p_2$
$\vdots$ $\vdots$ $\vdots$ $\vdots$ $\vdots$ $\vdots$
$x_n$ $p_{n1}$ $p_{n2}$ $\cdots$ $p_{nm}$ $p_n$
$q_1$ $q_2$ $\cdots$ $q_m$ $1$

この対応を $X$ と $Y$ の同時分布(または結合分布)(joint distribution)という.

$\displaystyle P(X=x_{i})=\sum_{j=1}^{m}p_{ij}=p_{i}$

$\displaystyle P(Y=y_{j})=\sum_{i=1}^{n}p_{ij}=q_{j}$

と定義したとき

$X$ $x_1$ $x_{2}$ $\cdots$ $x_{n}$
$P$ $p_1$ $p_{2}$ $\cdots$ $p_{n}$ $1$

$Y$ $y_1$ $y_{2}$ $\cdots$ $y_{m}$
$P$ $q_1$ $q_{2}$ $\cdots$ $q_{m}$ $1$

$X$ と $Y$ のそれぞれの確率分布を周辺分布という.


$X$ と $Y$ のそれぞれの実現値に対しての確率をまとめたものが同時分布で,$X$ と $Y$ のそれぞれに注目したものが周辺分布です.

同時分布とは,$X$ と $Y$ の2次元の確率分布です.$X$ と $Y$ にどういう関係があるかを探るのが今後の焦点になります.

例題と練習問題

例題

例題

$11$,$12$,$21$,$32$ と書いた $4$ 枚のカードがある.これらをよく切って $1$ 枚を取り出すとき,十の位の数字を $X$,一の位の数字を $Y$ とする.$X$ と $Y$ の同時分布を求めよ.


解答

$X$ $Y$ $1$ $2$
$1$ $\dfrac{1}{4}$ $\dfrac{1}{4}$ $\dfrac{1}{2}$
$2$ $\dfrac{1}{4}$ $0$ $\dfrac{1}{4}$
$3$ $0$ $\dfrac{1}{4}$ $\dfrac{1}{4}$
$\dfrac{1}{2}$ $\dfrac{1}{2}$ $1$

※ ちなみに $X$ と $Y$ の周辺分布はそれぞれ

$X$ $1$ $2$ $3$
$P$ $\dfrac{1}{2}$ $\dfrac{1}{4}$ $\dfrac{1}{4}$ $1$

$Y$ $1$ $2$
$P$ $\dfrac{1}{2}$ $\dfrac{1}{2}$ $1$

となります.

練習問題

練習

赤球 $3$ 個,白球 $2$ 個,黒球 $1$ 個,合計 $6$ 個が入っている袋から $1$ 個の球を取り出し元に戻すことを $3$ 回繰り返す.赤球が $X$ 回,白球が $Y$ 回出たとすると,$X$ と $Y$ の同時分布を求めよ.また,$X$ と $Y$ の周辺分布もそれぞれ求めよ.

練習の解答

 $P(X=i,Y=j)$

$=\dfrac{3!}{i!j!(3-i-j)!}\left(\dfrac{3}{6}\right)^{i}\left(\dfrac{2}{6}\right)^{j}\left(\dfrac{1}{6}\right)^{3-i-j}$

となるので,同時分布は

$X$ $Y$ $0$ $1$ $2$ $3$
$0$ $\dfrac{1}{216}$ $\dfrac{6}{216}$ $\dfrac{12}{216}$ $\dfrac{8}{216}$ $\dfrac{27}{216}$
$1$ $\dfrac{9}{216}$ $\dfrac{36}{216}$ $\dfrac{36}{216}$ $0$ $\dfrac{81}{216}$
$2$ $\dfrac{27}{216}$ $\dfrac{54}{216}$ $0$ $0$ $\dfrac{81}{216}$
$3$ $\dfrac{27}{216}$ $0$ $0$ $0$ $\dfrac{27}{216}$
$\dfrac{64}{216}$ $\dfrac{96}{216}$ $\dfrac{48}{216}$ $\dfrac{8}{216}$ $1$

周辺分布は

$X$ $0$ $1$ $2$ $3$
$P$ $\dfrac{27}{216}$ $\dfrac{81}{216}$ $\dfrac{81}{216}$ $\dfrac{27}{216}$ $1$

$Y$ $0$ $1$ $2$ $3$
$P$ $\dfrac{64}{216}$ $\dfrac{96}{216}$ $\dfrac{48}{216}$ $\dfrac{8}{216}$ $1$

※ 今回の同時分布は多項分布と呼ばれます.$X$,$Y$ はそれぞれ二項分布 $B\left(3,\dfrac{3}{6}\right)$,二項分布 $B\left(3,\dfrac{2}{6}\right)$ に従います.