はじめに
今回は「ヒストグラム(度数分布図)」について考えていきます。
ヒストグラムは前回Day2で学んだ「変数」について、これを可視化するための基本的な図になります。
変数を可視化しようとしたときに一番始めに頭に思い浮かべないといけないとても大切な図です!
ヒストグラムの確認
いま手元の標本データをみると何人かの成人男性の身長データがあったとします。
このデータには1人1人変化しうる(身長の)値が入っています。
このときこの身長という変数がどんな変数かをひと目見てわかるように可視化してあげたいとします。
そこで用いるのがヒストグラムで、以下のようなグラフとして変数を表現することができます。

ヒストグラムは横軸には変数の値をとります。
そして縦軸には度数をとります。
この度数とは何かというと「カウント数」です。
横軸の身長(length)という変数に対応する人が何人いたかをカウントしたものが度数(count)になります。
このカウント数を縦軸にとることによって上図のような棒グラフを並べたようなものができ、これをヒストグラムと呼びます。
ちなみに上記の身長に関するヒストグラムを性別に色分けすると以下のようになります。

ヒストグラムの良いところ
ヒストグラムの良いところは変数の情報がひと目でよくわかるという点です。
変数には大きく2種類の情報が含まれています。
1つが変数の値がどのくらいの値をとることが多いのかという情報、
もう1つが変数の値がどれくらいばらついているのかという情報です。
身長で考えると何cmくらいの人が多いのか、
そして、身長のばらつきはどれくらいか(身長が高い/低い人がどのくらいいるのか、そして、どの程度高い/低いのか)、
といった点が変数の重要な情報になります。
これを言い換えると「(度数)分布」と言い、上記の情報をひと目でわかるように可視化してくれるという点がヒストグラムの良いところというわけです。

上記のヒストグラムを見ると男性・女性の平均やばらつきがひと目でわかりますね!
まとめ
最後に今回の記事のポイントを整理します。
- ヒストグラムは横軸に変数の値を、縦軸に対応する度数をとった棒グラフのこと
- 変数の情報には大きくどのくらいの値をとることが多いのかという情報とどのくらい値がばらついているのかという情報がある
- ヒストグラムは度数の分布を示すことで上記の変数の情報をひと目でわかるように可視化してくれる
ヒストグラムはシンプルでありながら変数の度数分布の仕方を知ることのできるとても大切な図ですのでここでよく理解しておきましょう!
次回はもう1つの可視化ツールである散布図について見ていきます。
最後まで読んでいただきありがとうございました!

統計学の基礎を効率的に学べるベーシック講座です。統計学の入り口となる「確率分布・推定・検定」について豊富な図を用いて説明していきます。
2021年3月リリース後すでに20,000人以上の方に受講いただき大人気ベストセラーコースとなっています!ぜひこの機会に統計学や確率思考という一生モノのスキルを一緒に身につけましょう!
※上記リンクからですと時期によってはクーポンが自動適用されます。
※Udemyは世界最大級のオンライン学習プラットフォームです。以下記事にてUdemyをご紹介しておりますのでよろしければこちらもご覧ください。
