おいしい数学HOMEへのリンク

共分散の定義ともう一つの出し方

タイプ:難関大対策 レベル:★★ 


アイキャッチ

高校のデータの分析や統計学で扱う共分散の定義と,それから導かれる定理(別の公式)を紹介します.

このページは数列のシグマ表記がわかる人向けになります.







共分散の定義ともう一つの出し方

共分散には,定義と,定義から導かれる定理があります.定理の方は記載がない参考書が多いので紹介します.


ポイント

共分散

$\displaystyle s_{xy}=\frac{1}{n}\sum_{i=1}^{n}(x_{i}-\overline{x})(y_{i}-\overline{y})$ (定義)

 ↓(何回か式変形)

$\displaystyle \boldsymbol{s_{xy}=\overline{xy}-\overline{x} \cdot \overline{y}}$ (定理)


(※ただし,$\displaystyle \overline{xy}=\frac{1}{n}\sum_{i=1}^{n}x_{i}y_{i}$ とする.)


共分散は,( $x$ の偏差) $\times$ ( $y$ の偏差)の平均が定義です.式変形をすると $s_{xy}=\overline{xy}-\overline{x} \cdot \overline{y}$ が言えますが,証明できることなのでこれは定理です.なお,$\overline{xy}$ は便宜的な表記で,正式な表記でないことをここで断っておきます.

分散の定理( $s_{x}^{2}=\overline{x^{2}}-(\overline{x})^{2}$ )と似ていますね.共分散は,( $xy$ の平均)-( $x$ の平均)( $y$ の平均)で求めることができます.

定理を使った方が速い場合もありますし,定理を証明せよという出題も2016年に京都府立医科大や信州大学で見受けられました.




定理の証明

証明

$\displaystyle s_{xy}=\frac{1}{n}\sum_{i=1}^{n}(x_{i}-\overline{x})(y_{i}-\overline{y}) $ (定義)

 $=\displaystyle \frac{1}{n}\sum_{i=1}^{n}(x_{i}y_{i}-\overline{y}x_{i}-\overline{x}y_{i}+\overline{x}\cdot\overline{y})$

 $=\displaystyle \overline{xy}-\overline{y}\frac{1}{n}\sum_{i=1}^{n}x_{i}-\overline{x}\frac{1}{n}\sum_{i=1}^{n}y_{i}+\frac{1}{n}n\overline{x} \cdot \overline{y}$

 $=\overline{xy}-\overline{y} \cdot \overline{x}-\overline{x} \cdot \overline{y}+\overline{x} \cdot \overline{y}$

 $=\overline{xy}-\overline{x} \cdot \overline{y}$ (定理)


定義,定理どちらの公式を使うのがベストか,下の練習問題で是非試してみて下さい.




練習問題

練習

次のデータはある1月の田舎のサービスエリアで,その日の最高気温 $x$ (℃) とその日に売れた温かい甘酒の販売数 $y$ (本) の表である.平日の5日間をデータにまとめた.

曜日
$x$ $1$ $1$ $0$ $2$ $4$
$y$ $6$ $5$ $8$ $7$ $4$

(1) $x$,$y$ のデータの平均値 $\overline{x}$,$\overline{y}$ をそれぞれ求めよ.

(2) $x$,$y$ のデータの標準偏差 $s_{x}$,$s_{y}$ をそれぞれ求めよ.

(3) $x$,$y$ のデータの共分散 $s_{xy}$ と相関係数 $r$ をそれぞれ求めよ.

練習の解答



ノートに戻る