統計学

[統計Day8] 平均

はじめに

今回は平均について見ていきましょう。

平均も中央値と同様に代表値の1つで、

標本に含まれるデータの各値を合計したものを標本の大きさで割ることで計算できます。

それに加えて統計的にどんな意味をもっているかもあわせて考えていきます。

tota
tota
文系出身データアナリストのtotaです!初心者でも分かるように解説していきますね!

平均の計算

今回も身長データとしてAさん(166cm)、Bさん(170cm)、Cさん(172cm)の3人のデータで考えていきます。

平均の計算方法は言うまでもありませんが、

3人の身長の値をすべて足し合わせたものを標本の大きさである「3」で割ることで計算できます。

tota
tota
ちなみにこの「3人」のように1つの標本に含まれるデータの数のことを「標本の大きさ」または「サンプルサイズ」と呼びます

今回のケースでは

(166cm+170cm+172cm)÷3

となり、これを計算するとおよそ169.3cmとなります。

平均は「合計÷標本の大きさ」で計算!

平均の統計学的意味

上記の計算方法についてはご存じだと思いますが、

平均にもまた統計的な別の性質があります。

その性質は

各値との距離の2乗の合計を最短にする値

という性質です。

ポイントは距離の2乗という点です。

前回のDay7でみた中央値は、各値との単純な距離の合計を最短とするものでした。

それに対して平均は各値との距離の2乗の合計を最短にしてくれる性質があります。

数直線を引いて具体的に考えてみましょう。

Aさん、Bさん、Cさんの3人のデータに加え、

3人の身長の値から計算した平均169.3cmを基準値として赤い線で記しています。

このときこの平均を基準として「各値との距離の2乗の合計」を計算してみます。

平均169.3cmから

Aさんとの距離の2乗は3.3の2乗

Bさんとの距離の2乗は0.7の2乗

そしてCさんとの距離の2乗は2.7の2乗となります。

これらを合計すると18.7となりました。

実はこのようにして計算される「各値との距離の2乗の合計」を最短にしてくれるような基準というのが平均になります。

(図を再掲します)

つまり他のどんな値を基準に「各値との距離の2乗の合計」を計算したときよりも、上記のように「平均」を基準に計算したときの値が最短になります。

これは前回のDay7でみた中央値とは距離の考え方が異なりますよね。

中央値の場合は

【中央値】各値との距離の合計を最短にする

という性質でした。

これに対して平均は

【平均】各値との距離の2乗の合計を最短にする

この2乗というのが平均という指標のポイントになります。

平均は距離の2乗の合計を最短にする値、

とくに2乗をベースとした性質があるという感覚を

ぜひここで掴んでおきましょう。

まとめ

最後に今回の記事のポイントを整理します。

  • 平均は標本の各値を合計し標本の大きさで割ることで計算できる代表値
  • 平均には「各値との距離の2乗の合計を最短にする値」という統計的な性質をもっている
  • 平均はとくに「2乗」をベースとする指標という点がポイントである

今回も最後まで読んでいただきありがとうございました!

 

統計学ベーシック講座【確率分布・推定・検定】

統計学の基礎を効率的に学べるベーシック講座です。統計学の入り口となる「確率分布・推定・検定」について豊富な図を用いて説明していきます。

2021年3月リリース後すでに20,000人以上の方に受講いただき大人気ベストセラーコースとなっています!ぜひこの機会に統計学や確率思考という一生モノのスキルを一緒に身につけましょう!

※上記リンクからですと時期によってはクーポンが自動適用されます。
※Udemyは世界最大級のオンライン学習プラットフォームです。以下記事にてUdemyをご紹介しておりますのでよろしければこちらもご覧ください。

Udemyとは?セールでお得な世界最大級のオンライン学習プラットフォームこの記事では世界最大級のオンライン学習プラットフォームであるUdemyをご紹介していきます!まだUdemyを使っていない方やこれから使お...