●ヒストグラムは単なる棒グラフとは違う

 「ビッグデータやデータ・サイエンティストに注目が集まっているためか、統計学への関心が高まっているようだな」

 そうみたいだな。ま、統計学とExcelは切っても切れぬ関係だから、結構なことだな。そういえば、統計学では度数分布表やヒストグラムを活用するが、これらを作成する機能がExcelにはある。あまり紹介されない機能だから、ここで触れる価値は大いにあるだろう。

 「ヒストグラムって、あの棒グラフのことか」

 うーん、微妙に違うな。一般に度数分布表をグラフ化したものをヒストグラムと呼ぶ。図1をもとに説明したほうが早そうだ。こちらはA2:E6に年齢が記してあると考えてもらいたい。このままだとどの年齢の人が多いのか見当がつかない。そこで分類の基準に相当する「階級」を設けて集計する。この集計表が度数分布表だ。

Excelの度数分布表作成機能を利用するには、A9:A15のように階級区分を作っておく。なお、「データ」タブに「データ分析」ボタンが見当たらない人は、「ファイル」タブ→「オプション」→「アドイン」画面の下部にある「管理」で「Excelアドイン」を選び、「設定」ボタンを押して「分析ツール」にチェックを入れる
図1 度数分布表とヒストグラムを作る下準備
図1 度数分布表とヒストグラムを作る下準備
[画像のクリックで拡大表示]

 Excelにはこの度数分布表と、そこからヒストグラムを作る機能がある。この例の場合だと、年齢だから10代や20代といった階級を設けるのが一般的だろう。A9:A15にはこの階級の最大値を入力してある。これは度数分布表を作るための下準備だ。

 では、「データ」タブから「データ分析」をクリックして、開いたダイアログから「ヒストグラム」を選ぶ。そして図1のように設定して「OK」ボタンを押す。