← → キーで移動
共通テスト数学 対策講座
第15講
データの分析
平均・分散・標準偏差・相関係数 ── 共通テスト超頻出
福岡先生 15分で得点源に変える

今日のゴール

Goals of this lecture

01
平均・分散・標準偏差を計算
データから3つの統計量を反射で出す
02
相関係数の意味を理解
$-1 \leq r \leq 1$ の解釈と計算
03
箱ひげ図・散布図を読む
視覚的な統計表現の読み取り方
結 論

データの「中心」と「ばらつき」を測る

中心
平均・中央値
$\bar{x} = \dfrac{1}{n}\sum x_i$
訳:データの真ん中
ばらつき
分散・標準偏差
$s^2 = \dfrac{1}{n}\sum(x_i - \bar{x})^2$
訳:広がりの大きさ
基本公式

3つの統計量

STATISTICS
平均:$\bar{x} = \dfrac{1}{n}\sum_{i=1}^{n} x_i$
分散:$s^2 = \dfrac{1}{n}\sum_{i=1}^{n}(x_i - \bar{x})^2$
標準偏差:$s = \sqrt{s^2}$
分散の単位は2乗、標準偏差は元のデータと同じ単位。
具体例 ①

データ $\{2, 4, 6, 8, 10\}$ の分散

1
平均を計算
$\bar{x} = \dfrac{2+4+6+8+10}{5} = \dfrac{30}{5} = 6$
2
偏差の2乗の和
$(2-6)^2 + (4-6)^2 + (6-6)^2 + (8-6)^2 + (10-6)^2 = 16+4+0+4+16 = 40$
3
分散
$s^2 = \dfrac{40}{5} = 8$。標準偏差は $s = \sqrt{8} = 2\sqrt{2}$
相関係数

2変量の関係を測る

CORRELATION
$r = \dfrac{s_{xy}}{s_x \cdot s_y}$
$s_{xy} = \dfrac{1}{n}\sum(x_i - \bar{x})(y_i - \bar{y})$ ── 共分散
$-1 \leq r \leq 1$。$r > 0$:正の相関 / $r < 0$:負の相関 / $r = 0$:無相関。
相関係数の解釈

値の大きさで関係の強弱が分かる

$|r| \geq 0.7$
強い相関
一方が増えるともう一方も変化する傾向が強い。散布図が線に近い形。
$|r| < 0.3$
弱い相関
関係性がほとんど見えない。散布図がバラバラに散らばる。
相関係数の符号と絶対値を見れば、2変量の関係が一目で分かる。
視覚化

箱ひげ図 ── 5数で全体像を見る

最小値・第1四分位・中央値・第3四分位・最大値の5点でデータの分布を表す
データの「偏り」「広がり」を視覚的に把握できる
箱ひげ図の3要素
1
第1四分位〜第3四分位 ── 中央50%
2
ひげ
最小値・最大値 ── 全範囲を表す
3
中央線
中央値(第2四分位)── 真ん中の値
統計の解釈

よくある誤読を避ける

罠 ①
平均だけで判断
「平均70点」だけ見ても、全員70点 or 0点と140点が半々、を区別できない。分散を見る。
罠 ②
相関 ≠ 因果
$r$ が高くても「AがBを引き起こす」とは限らない。第3の変数が原因のことも。
統計データは複数の指標を組み合わせて解釈 ── 1つの数字だけで結論を出さない。
実戦演習

共通テスト形式で確認

問 データ $\{2, 4, 6\}$ の分散は?
$\dfrac{2}{3}$
$\dfrac{4}{3}$
$\dfrac{8}{3}$ ◀ 正解
$2$
平均 $\bar{x} = 4$。偏差の2乗の和 $= (2-4)^2 + (4-4)^2 + (6-4)^2 = 4 + 0 + 4 = 8$。分散 $= 8/3$ ── ③。

本日のチェックリスト

反射で答えられたら習得完了

平均の式は?
$\dfrac{1}{n}\sum x_i$
分散の式は?
$\dfrac{1}{n}\sum(x_i - \bar{x})^2$
標準偏差は?
$\sqrt{s^2}$
相関係数の範囲は?
$-1 \leq r \leq 1$
箱ひげ図の中央線は?
中央値(第2四分位)
NEXT
第16講
共通テスト本番想定演習
60分一本勝負
予 習 の す す め
次回は実戦力の最終テスト ── ここまで学んだ全てを総動員します。