はじめに
今回は分散と標準偏差について見ていきましょう。
分散・標準偏差も平均偏差と同様に「ばらつき度合い」の指標の1つになります。
実は分散には標本分散と不偏分散という2つの分散があるのですが、
本記事では標本分散について取り上げたいと思います。
標本分散の計算
前回みてきた平均偏差は「中央値との距離」を標本の大きさで割った値でした。
それに対して分散は「平均との距離の2乗」を標本の大きさで割った値になります。
平均を基準にするということと
ばらつき度合いを単純な距離ではなく
距離を2乗して計算するという点がポイントです。

今回も前回同様の標本データで考えていきましょう。
数直線を引いて3人の身長データを並べます。

ここで基準とする平均169.3cmとそれぞれの値との距離の2乗を考えます。
166cmのAさんとの距離の2乗は3.3の2乗
170cmのBさんとの距離の2乗は0.7の2乗
そして172cmのCさんとの距離の2乗は2.7の2乗となります。
分散というばらつき指標は、この距離の2乗を全員分合計し
それを標本の大きさで割った値となります。
平均との距離の2乗の合計 ÷ 標本の大きさ
実際に計算すると、
(3.3の2乗+0.7の2乗+2.7の2乗)÷ 3 ≒ 6.2
結果として分散はおよそ6.2と計算できます。
分散の理解しにくさ
上記の計算結果をみて、分散の値をばらつき指標として直感的に理解しやすいと感じるでしょうか。
おそらく分散よりも平均偏差のほうが直感的に理解しやすいと感じる方もいると思います。
というのも平均偏差は2乗などしておらず「cm」の単位でそのまま考えることができました。
それに対して分散は2乗の距離をベースに計算されていて
計算された6.2という値を尺度としてどう捉えればよいのか
直感的にイメージしづらいという背景があると思います。
それでも分散は重要
それでも統計学においては分散に勝る重要なばらつき指標は他にありません!
その1つの理由としては2乗することによりプラスマイナスの符号の影響を受けないというメリットがあります。
これまで距離を数直線上で考えてきたのですべてプラスで表記していましたが
実際に計算する際には絶対値をつけてマイナスの場合はプラスに変換するという作業が生じます。
分散は2乗により計算をしているためマイナスのときにプラスに変換するという計算の手間を省くことができます。
またもう1つの理由としては、距離を2乗して測るという考え方が統計学の様々な理論において重要な役割を果たしているという点があげられます。
最小2乗法というデータのあてはまりの良さを測る手法をはじめ
統計学は距離を2乗して計算する考え方を多くの理論で採用しています。
したがって2乗をベースにした平均や
その平均との距離の2乗を用いて計算される分散
という指標が様々な理論のベースとなっているという事実があります。
標準偏差
上記のような理由から分散は確かに重要なばらつき指標なのですが
分散の直感的に理解しづらいという問題をどうにかできないか
という発想から生まれたのが標準偏差です。

標準偏差の計算は簡単で分散の平方根をとってあげるだけです。
平方根をとることで分散の2乗の尺度を元に戻してあげて
直感的に理解しやすい尺度に変換してあげたものが標準偏差というわけです。
まとめ
最後に今回の記事のポイントを整理します。
- 分散には標本分散と不偏分散がある
- 標本分散は平均から各値との距離の2乗の合計を標本の大きさで割ることで計算できる
- 分散は2乗しているために尺度を直感的に理解しづらい
- それでもなお統計学においては分散は最も重要なばらつき指標である
- 分散の平方根をとったものが標準偏差
今回も最後までご覧いただきありがとうございました!

統計学の基礎を効率的に学べるベーシック講座です。統計学の入り口となる「確率分布・推定・検定」について豊富な図を用いて説明していきます。
2021年3月リリース後すでに20,000人以上の方に受講いただき大人気ベストセラーコースとなっています!ぜひこの機会に統計学や確率思考という一生モノのスキルを一緒に身につけましょう!
※上記リンクからですと時期によってはクーポンが自動適用されます。
※Udemyは世界最大級のオンライン学習プラットフォームです。以下記事にてUdemyをご紹介しておりますのでよろしければこちらもご覧ください。
