統計学

[統計Day1] 母集団と標本

はじめに

記念すべき第1回目の記事は「母集団と標本」についてです!

母集団と標本は統計学の基本中の基本で、統計学を考えるスタート地点とも言える重要な用語です。

いずれ学んでいく確率の話や推定、仮説検定の話(というか統計学全体)にも大いに関係してくる用語ですのでしっかり理解しておきましょう!

tota
tota
文系出身データアナリストのtotaです!初心者でも分かるように解説していきますね!

母集団

まず私たちが分析を行う際にもっとも重要なことは何かというと、

それは問いの対象がなにか、知りたいことは何かをしっかりと定義することですよね。

この問いの対象、知りたいことのことを統計学では「母集団(Population)」と呼びます。

例えば、日本の30代の年収について知りたいのであれば

「日本に暮らす30代のすべての人々の年収」が母集団になります。

あるいはある商品の既存利用者について知りたければ

「その商品を利用したことがある人すべて」が母集団になります。

このように母集団は一般的に規模の大きな集団として想定されます。

したがって大抵の場合は母集団の1人1人すべてをつぶさに見ることは不可能です。

つまり母集団はいまだ知ることのない「未知なる集団」ということになります。

母集団は比較的規模が大きく「未知なる」集団!

標本

一方でこの母集団から一部だけ抽出されたものを「標本(Sample)」と呼びます。

私たちが手にとって見ることのできる世界、

私たちの手元にあるデータというのは

「標本」の世界になります。

大切なのは母集団と標本は決してイコールの関係ではなく別物であるということです。

とはいえこのままでは問いの対象である母集団に迫ることができない…。

そこでなんとかこの母集団がどんなものなのかについて迫るために、

手元の標本を手がかりに母集団を推測しようとします。

この母集団を手元の標本を手がかりに推測しようとすることこそ統計学の目的の1つ(推測統計学と言います)です。

まとめ

最後に今回の記事のポイントを整理します。

  • 母集団問いの対象/知りたいことそのものである
  • 母集団は規模の大きな集団として想定される未知なる集団である
  • 標本は母集団から一部抽出されたものである
  • 手元にあるデータは母集団ではなく標本である
  • 統計学では手元の標本を手がかりに母集団を推測する

どのように標本から母集団を推測するかという話は今後ひとつひとつ学んでいくとして、

次回は標本を特徴づけてくれる「変数」というものについて見ていきたいと思います!

最後まで読んでいただきありがとうございました!

統計学ベーシック講座【確率分布・推定・検定】

統計学の基礎を効率的に学べるベーシック講座です。統計学の入り口となる「確率分布・推定・検定」について豊富な図を用いて説明していきます。

2021年3月リリース後すでに20,000人以上の方に受講いただき大人気ベストセラーコースとなっています!ぜひこの機会に統計学や確率思考という一生モノのスキルを一緒に身につけましょう!

※上記リンクからですと時期によってはクーポンが自動適用されます。
※Udemyは世界最大級のオンライン学習プラットフォームです。以下記事にてUdemyをご紹介しておりますのでよろしければこちらもご覧ください。

Udemyとは?セールでお得な世界最大級のオンライン学習プラットフォームこの記事では世界最大級のオンライン学習プラットフォームであるUdemyをご紹介していきます!まだUdemyを使っていない方やこれから使お...