はじめに
今回は平均偏差について見ていきましょう。
前回までは記述統計の2つの論点のうち「代表値」に関する話でしたが、
ここからはもう1つの論点である「ばらつき度合い」に関する話に入っていきます。
平均偏差の計算
平均偏差はその変数における「各値と中央値との距離の平均」という言い方ができます。
今回も標本として前回と同様の3人の身長データ(166cm、170cm、172cm)があったとします。

この3人の身長という変数について
「平均的な中央値との距離」
というのはどういうことでしょうか。
いまいちど数直線を引いて考えましょう。

ここに3人のデータを並べています。
このとき中央値はちょうど真ん中の順位であるBさんの170cmです。
したがって「各値と中央値170cmとの距離」というのは、
166cmのAさんとの距離が4、
170cmのBさんとの距離が0、
そして172cmのCさんとの距離が2
となります。
平均偏差はこの距離の合計を平均してあげる、
つまり、標本の大きさで割ってあげることで計算できます。
中央値との距離の合計 ÷ 標本の大きさ
実際に計算すると、
(4+0+2)÷ 3=2
結果として平均偏差は2cmと計算できます。
平均偏差が意味するところ
上記のように計算できた平均偏差2cmというのは、つまり「3人の身長は中央値から平均的には2cm離れていますよ」ということを意味します。
これはばらつき指標として直感的に理解しやすいと思います。
1人あたり2cmだけ中央値から離れている、つまり、ばらついているということで、
数直線に並べた3人の値の距離感からも納得感があります。
(図を再掲します)

ただ実はこの平均偏差は次回の記事で見ていく分散や標準偏差に比べてあまり使われていないのが実情です。
(平均偏差は直感的にばらつき指標としてとても理解しやすいのでもうちょっと使われてもよいのかなと思うのですが…)
平均からの平均偏差
ちなみにいま距離を中央値からの距離で計算しました。
場合によってはこの距離を中央値ではなく平均からの距離で計算することもあります。
平均との距離の合計 ÷ 標本の大きさ
したがって中央値からの距離により計算する平均偏差を「中央値からの平均偏差」、
平均からの距離により計算する平均偏差を「平均からの平均偏差」と
誤解のないように表記してあげた方がよいでしょう。
ここでちょっと思い出していただきたいのは中央値がどういう性質のものだったかということです。
中央値は「各値との距離の合計を最短にする値」でしたよね。
そして距離の合計というのはいま見てきた平均偏差の分子そのものです。
したがって中央値からの平均偏差の方が、平均からの平均偏差よりも、小さくなります。
平均偏差の分子である「各値との距離」を最短にする値こそ中央値であるので当然ですね!
逆にいうと平均からの平均偏差は「最短」とはならないので、平均偏差を計算する際は「中央値からの平均偏差」を計算する方がおさまりが良いでしょう。
まとめ
最後に今回の記事のポイントを整理します。
- 平均偏差は「各値と中央値との距離の平均」
- 平均偏差はばらつき指標として直感的に理解しやすい
- 平均偏差は中央値からの平均偏差と平均からの平均偏差がある
- 平均からの平均偏差よりも中央値からの平均偏差の方が小さくなる
ということで平均偏差を見てきましたが、次回は分散という統計学においていちばん大切なばらつき指標を見ていきたいと思います。
今回も最後までご覧いただきありがとうございました!

統計学の基礎を効率的に学べるベーシック講座です。統計学の入り口となる「確率分布・推定・検定」について豊富な図を用いて説明していきます。
2021年3月リリース後すでに20,000人以上の方に受講いただき大人気ベストセラーコースとなっています!ぜひこの機会に統計学や確率思考という一生モノのスキルを一緒に身につけましょう!
※上記リンクからですと時期によってはクーポンが自動適用されます。
※Udemyは世界最大級のオンライン学習プラットフォームです。以下記事にてUdemyをご紹介しておりますのでよろしければこちらもご覧ください。
