統計学

[統計Day5] 記述統計

はじめに

今回は記述統計について見ていきます。

前回までを簡単に振り返ると、はじめに母集団標本、そして変数という統計学の基本的な用語を確認しました。

そして変数に含まれる情報をひと目で見てわかるようにしようということでヒストグラム散布図という重要な可視化ツールを見てきました。

この記事で取り扱う記述統計もまた、変数に含まれる情報を表現しようとするものです。

ただ記述統計というのは、ヒストグラムや散布図のように変数を図で表現するのではなく、具体的な「数値」で変数の情報を表現しようとするものになります。

tota
tota
文系出身データアナリストのtotaです!初心者でも分かるように解説していきますね!

記述統計の役割

例えば今回も身長という変数と体重という変数をデータとしてもつ標本を考えます。

Day3やDay4ではヒストグラムで変数の分布を可視化したり、

散布図で身長と体重の2つの変数の関係を見たりしてきました。

これらの可視化ツールはひと目で変数の情報を把握できるという点で非常に強力です。

しかしこれはある意味、抽象的というか右脳的な把握にとどまる面があります。

変数の情報を誰かに説明をしたり、

さらに深堀りして分析をしたりする際には、

図だけではなく具体的な値や指標によって変数を記述してあげる必要がありますよね。

そこで用いられるのが記述統計というものになります。

具体的な値でデータを表現(記述)するのが記述統計!

記述統計の論点

記述統計の論点は大きく2つです。

1つは「その変数をどんな値がもっともよく代表しているか」を考える代表値の論点。

そしてもう1つは「その変数がどれくらいばらついているか」を考えるばらつき指標の論点です。

身長という変数の例で言えば、

標本1人1人でいろんな身長の値をとりうるけれど、あえてこの標本における代表的な身長の値を決めるとしたらどんな値だろうか?

という観点が代表値の論点です。

また、

標本1人1人で身長が高い人もいれば低い人もいて身長の値はばらついているはずだけど、その身長のばらつき度合いを数値で表現できないだろうか?

という観点がばらつき度合いの論点です。

この代表値の論点とばらつき指標の論点において、それぞれいくつかの計算指標があります。

それについて次の記事から見ていきたいと思います。

まとめ

最後に今回の記事のポイントを整理します。

  • 記述統計は変数の情報を具体的な数値で書き記すもの
  • 記述統計には大きく2つの論点がある
  • 1つは「その変数をどんな値がもっともよく代表しているか」を考える代表値の論点
  • もう1つは「その変数がどれくらいばらついているか」を考えるばらつき指標の論点

今回も最後まで読んでいただきありがとうございました!

統計学ベーシック講座【確率分布・推定・検定】

統計学の基礎を効率的に学べるベーシック講座です。統計学の入り口となる「確率分布・推定・検定」について豊富な図を用いて説明していきます。

2021年3月リリース後すでに8,500人以上の方に受講いただきベストセラーとなっています!ぜひこの機会に統計学や確率思考という一生モノのスキルを一緒に身につけましょう!

※上記リンクからですと時期によってはクーポンが自動適用されます。
※Udemyは世界最大級のオンライン学習プラットフォームです。以下記事にてUdemyをご紹介しておりますのでよろしければこちらもご覧ください。

Udemyとは?セールでお得な世界最大級のオンライン学習プラットフォームこの記事では世界最大級のオンライン学習プラットフォームであるUdemyをご紹介していきます!まだUdemyを使っていない方やこれから使お...