Excel講座

度数分布表とクロス集計

本章で用いる実習用ファイル

一つのカテゴリーで集計することを単純集計と呼ぶ。特にその中でカテゴリーごとのデータの数を集計したものを度数分布表と呼ぶ。

複数のカテゴリーを掛け合わせて集計することをクロス集計と呼ぶ。属性間での傾向を比較するときなどに、クロス集計は用いられる。アンケート調査では必須の集計方法である。今回はExcelでクロス集計する方法を考える。

ABCDEF
1No名前グループ身長血液型
21中澤裕子モーニング娘。158O
32石黒彩モーニング娘。160A
43飯田圭織モーニング娘。167A
54安倍なつみモーニング娘。152A
65福田明日香モーニング娘。149B
122121山﨑愛生モーニング娘。159B
123122橋迫鈴アンジュルム152O
124
全データ
名前定義

セルには以下のように名前を定義している。

グループ
C2:C123
身長
D2:D123
血液型
E2:E123

単純集計

一般的な集計

カテゴリーごとにデータの数や合計・平均値などの統計量を求めるときに条件付き集計を行う。

GHIJ
1血液型人数平均身長
2A52158.20
3B22157.59
4O40157.69
5AB8156.38
6全血液型122157.80
7
課題:単純集計(xlsx形式)

セルH2,H6,I2,I6に式を立て、残りはオートフィルを用いて表を完成させよ。

度数分布表

カテゴリーは質的データを使うのが一般的だが、身長のような量的データを使うこともできる。その際は適当な幅で区切ってカテゴリー化する。このときの区切りをビンと呼ぶ。

今回はビンを140(cm)を最小に、5(cm)区切りで設定した。

140-145145-150150-155155-160160-165165-170170-175175-180180-185

140-145の区切りは

  • 140以上150未満
  • 140より大きく150以下

という二つの方式があるが、日本では一般的に「140以上150未満」とするのが一般的なので、そちらを採択する。

GHI
8人数
91400
101453
1115035
1215541
1316030
1416511
151701
161750
171801
181850
19

セルH9には「身長>=140(F9)」かつ「身長<145(F10)」の条件に当てはまる「身長」のデータ数を求める式を入力する。

この度数分布表をグラフにしたものがヒストグラムである。

課題:度数分布表(xlsx形式)

COUNTIFS関数およびCOUNT,IF二つの関数を用いた配列数式、両方の式を立てよ。

COUNTIFS関数を用いた場合
GHI
8人数
9140=COUNTIFS(身長,">="&G9,
10145
11150
12155
13160
14165
15170
16175
17180
18185
19
COUNT関数IF関数を用いた場合
GHI
20人数
21140=COUNT(IF((身長>=G21)*(
22145
23150
24155
25160
26165
27170
28175
29180
30185
31

途中まで書いてあるので、その続きを考えよ(cf.大なり小なりを含む条件)。

クロス集計

クロス集計1
KLMN
1グループ血液型人数
2モーニング娘。A21
3モーニング娘。B6
4モーニング娘。O14
5モーニング娘。AB3
6Berryz工房A1
37BEYOOOOONDSAB1
38

グループと血液型という複数のカテゴリーごとの平均値を求めるのがクロス集計である。複数条件の集計を行えば良い。

しかしこの表は(EXCELでの集計はしやすいが)見づらい。そこでカテゴリーをクロスさせた表にするのが一般的である。

クロス集計2
OPQRSTU
1ABOAB
2モーニング娘。21614344
3Berryz工房12508
4℃-ute41218
5アンジュルム1025118
6Juice=Juice41409
7カントリー・ガールズ12306
8こぶしファクトリー23218
9つばきファクトリー14319
10BEYOOOOONDS812112
115222408122
12

課題:グループ・血液型のクロス集計(xlsx形式)

セルP2に条件付き集計を行う式を立て、オートフィルでセルS10まで求めよ。S列および11行は合計(SUM)せよ。

OPQRSTU
1ABOAB
2モーニング娘。
3Berryz工房
4℃-ute
5アンジュルム
6Juice=Juice
7カントリー・ガールズ
8こぶしファクトリー
9つばきファクトリー
10BEYOOOOONDS
11
12

前述の通り、複数条件の集計を行えば良いのだが、条件指定が行方向(グループ名)列方向(血液型)に分かれている点に注意が必要である。九九表を応用すること。

課題:身長・血液型のクロス集計(xlsx形式)

身長を5cmで区切ったものと血液型を人数で集計したクロス集計表を作成せよ。

OPQRSTU
13ABOAB
1414000000
1514511103
1615011715135
171552088535
1816013412141
19165614011
2017010001
2117500000
2218001001
2318500000
245222408122
25