統計学

[統計Day12] 標準化

はじめに

今回は標準化について見ていきましょう。

標準化というのは変数を変換する手法で、統計学における極めて重要な手法になります。

tota
tota
文系出身データアナリストのtotaです!初心者でも分かるように解説していきますね!

標準化の計算方法

ここに標本として抽出された4人(A〜Dさん)の国語算数のテストの点数についてのデータがあったとします。

ここで例えばAさんの点数をみると国語が90点算数が85点でした。

このときAさんは国語の点数のほうが算数の点数よりも高かったからといって、国語の方が算数よりも良い結果だった…と安易に言うことはできないですよね。

というのも、国語と算数は別の世界の話であって、国語の点数と算数の点数を比較するには、少なくとも両者の基準をそろえる必要があるからです。

そこでこの変数について、代表値として平均を、ばらつき指標として標準偏差を計算してみます。

すると国語の点数の平均は92点、算数の点数の平均は80点

また国語の点数の標準偏差は2.9、算数の点数の標準偏差は17.2となっていました。

つまり、国語は平均92点、標準偏差2.9の世界であるのに対し、

算数は平均80点、標準編偏差17.2の世界となっており、

やはり両者は基準の異なる別世界であることがわかります。

平均と標準偏差が違えば異なる基準の別世界!

そこで、国語と算数という別世界を同じ世界にしてあげるために、

平均と標準偏差を同じ値にそろえてあげたいと考えます。

具体的には平均を0点、標準偏差を1の世界にそろえてあげたいと考えます。

そうすることで国語と算数の基準がそろって、両者の点数を比較することができますよね!

実はこの平均0、標準偏差1の世界にそろえてあげることを標準化と呼びます。

平均0、標準偏差1の世界にそろえる!=標準化!

では標準化して平均0、標準偏差1の世界にそろえるためにどうすればよいかというと、

まず平均を0にしたいので、A~Dさんの4人のそれぞれの点数からもともとの平均を引きます。

そして標準偏差を1にしてあげたいので、A~Dさんの4人のそれぞれの点数を、もともの標準偏差で割ってあげます。

国語でいうと4人の点数をみんな2.9で割ってあげることで、元々2.9あった標準偏差が1に戻されることになります。

この計算によって以下の図のように国語も算数も、平均0、標準偏差1の世界に変換してあげることができるというわけです。

変換後のAさんの点数を見てみると、

国語は-0.69点、

算数は0.29点

という結果で、算数の方が点数が高くなっています。

つまり国語と算数を同じ基準の世界に変換してみたら実は算数の方がよい結果であったということがわかります。

このように標準化というのは変数の基準をそろえるための重要な変数変換の手法になります。

平均を引く、標準偏差で割る、というフレーズはもう呪文のように体に染み付かせておきましょう。

平均を引く、標準偏差で割る

平均を引く、標準偏差で割る

平均を引く、標準偏差で割る

もう体に染み付きましたかね!

とても重要なものですので、ぜひここで平均を引く、標準偏差で割る、という呪文を身に着けておいてください!

まとめ

最後に今回の記事のポイントを整理します。

  • 標準化とは異なる変数の基準をそろえる変換のこと
  • 標準化により平均0、標準偏差1の世界にそろえる
  • そのために平均を引く、標準偏差で割るという計算を行う
  • 標準化により異なる変数を比較できるようになる

今回も最後までご覧いただきありがとうございました!

統計学ベーシック講座【確率分布・推定・検定】

統計学の基礎を効率的に学べるベーシック講座です。統計学の入り口となる「確率分布・推定・検定」について豊富な図を用いて説明していきます。

2021年3月リリース後すでに20,000人以上の方に受講いただき大人気ベストセラーコースとなっています!ぜひこの機会に統計学や確率思考という一生モノのスキルを一緒に身につけましょう!

※上記リンクからですと時期によってはクーポンが自動適用されます。
※Udemyは世界最大級のオンライン学習プラットフォームです。以下記事にてUdemyをご紹介しておりますのでよろしければこちらもご覧ください。

Udemyとは?セールでお得な世界最大級のオンライン学習プラットフォームこの記事では世界最大級のオンライン学習プラットフォームであるUdemyをご紹介していきます!まだUdemyを使っていない方やこれから使お...