はじめに
今回は「変数(variable)」について考えていきます。
変数というのは統計学をはじめ、データ分析をする際に絶対に理解しておかないといけない重要な用語ですので、ここでしっかり理解しておきましょう!
変数とは
変数というのは難しいものではなく、単純に文字通り「変化する値」あるいは「変化しうる値」のことを変数と呼びます。
いま手元に標本として3人のデータがあったとします。
この3人について「身長」のデータと「性別」についてのデータが入っていたとします。
身長については3人はそれぞれ166cm、170cm、172cmという値が入っていました。
そして「性別」については「男性」「女性」「その他」といったデータが入っていました。
このとき身長のデータや、性別のデータは1人1人で変化しうる値となっていますよね。
このように1人1人で変化しうるような値のことを変数と呼びます。
変数の役割
変数は非常に重要です。
というのも変数はこの1人1人の違いを情報として表現してくれるものだからです。

違いを表現してくれるということはつまり、
変数は標本として抽出された1人1人を
「特徴づけてくれる値」
という言い方もできます。
身長の違いや性別の違いはある意味で1人1人の個性ですよね。
その個性を明らかにしてくれるものが変数というわけです。
各サンプルの違いがこの変数に詰め込まれています。
だからデータを分析する私たちにとって変数は極めて重要になります。
変数の注意点
そして注意しておかないといけないのは値が数値でなくても「変数」であるということです。
性別についての変数では値が「男性」「女性」「その他」といった「言葉」で表現されています。
こういった「言葉」で表現されるようなデータをカテゴリーデータとか質的変数、名義尺度とか呼んだりします。
大切なのはこういったカテゴリ的な値であっても変数であることに変わりはないという点です。
変数というと「数」という文字から数値でないと違和感があるかもしれません。
しかし数値でなくても値が変化して各サンプルを特徴づけてくれいることに変わりはありません。
したがって数値でなくカテゴリ的な値であっても変数と呼ぶことになります。
この点はぜひ注意しておきましょう。
まとめ
最後に今回の記事のポイントを整理します。
- 変数とは変化する値、変化しうる値のこと
- 変数は標本の1人1人を特徴づけてくれる役割がある
- 値が数値でなくカテゴリ的な値でも変数と呼ぶ
今回は「変数」について見てきました。
次の記事ではこの変数の情報を一目で分かるように可視化することを考えていきます。
最後まで読んでいただきありがとうございました!

統計学の基礎を効率的に学べるベーシック講座です。統計学の入り口となる「確率分布・推定・検定」について豊富な図を用いて説明していきます。
2021年3月リリース後すでに20,000人以上の方に受講いただき大人気ベストセラーコースとなっています!ぜひこの機会に統計学や確率思考という一生モノのスキルを一緒に身につけましょう!
※上記リンクからですと時期によってはクーポンが自動適用されます。
※Udemyは世界最大級のオンライン学習プラットフォームです。以下記事にてUdemyをご紹介しておりますのでよろしければこちらもご覧ください。
