Excelで学ぶ統計講座(初級)

クロス集計と比率

本章で用いる実習用ファイル

μ国で有権者を対象に政治意識調査を行った。調査は無作為抽出で対象者を選び、500人から回答を得られた。

問1 あなたの性自認(Gender)は何ですか。
  1. 男性(male)
  2. 女性(female)
問2 あなたの住所登録がなされている府(Prefecture)はどこですか。
  1. Morn
  2. Angerm
  3. Juic
  4. Magnol
  5. Camell
  6. Beyond
問3 あなたの支持政党(Party)は何党ですか。
  1. 保守党(Conservative)
  2. 民主党(Democratic)
  3. 特になし(unaffiliated)
問4 あなたは現内閣を支持(CabinetSupport)しますか。
  1. 支持する(Yes)
  2. 支持しない(No)

この調査から得られた下記データより、現住所(Prefecture)と支持政党(Party)との関連に付いて得られる知見を述べよ。

ABCDEF
1NoGenderPrefecturesPartyCabinetSupport
21femaleCamellunaffiliatedNo
32femaleMornunaffiliatedNo
43maleMagnolunaffiliatedYes
54maleAngeremunaffiliatedNo
65femaleMagnolunaffiliatedYes
76maleMornConservativeYes
87maleCamellDemocraticNo
μ国政治意識調査
名前定義

セルには以下のように名前を定義している。

Prefectures
C2:C123
Party
D2:D123

クロス集計

まずはデータより現住所と支持政党に関するクロス集計を行う。この集計表は実際に観測して得られた値、観測値(実測値)によるクロス集計表(分割表)である。

観測値(現住所*支持政党)
GHIJK
1ConserativeunaffiliatedDemocratic
2Cammell10165682
3Morn39322596
4Magnol36262587
5Angerem31253591
6Juic16332372
7Beyond18332172
8150165185500

クロス集計表は行数と列数で大きさを表現する。このクロス集計表は5行3列のクロス集計表である。

観測値(性自認*内閣支持)
MNOP
1YesNo
2male124120244
3female107149256
4231269500

性自認*内閣支持のクロス集計表は2行2列のクロス集計表となる。

比率計算

この調査で見たいのは現住所(居住地域)で政治的意識がどのような違いが出るか、である。このように属性的なものと意識・行動との関連を見るときにクロス集計表は用いられる。

しかし属性によるカテゴリーのサンプルサイズが異なれば、その意識・行動の違いを観測値ベースで比較してもあまり意味がない。

大学1年生の政治意識調査
投票に行く行かない
20以上252550
20未満3070100
5595150

このようなクロス表が得られたとして、20未満の学生は20以上の学生より投票に行く傾向がある、という解釈は端的に間違っている。投票に行くとしているのが、20以上の学生は50%に対して、20未満の学生は30%に過ぎない。つまり比率で比較しなければならない。

というわけで比率計算を行う。

比率計算(部分/全体)は分母となる基準値をどこに置くかによって3種類ある。一般的にクロス集計表で欲しい比率は属性ごとの比率なので、属性を行側に置けば「行方向の比率」を用いる。

行方向の比率
投票に行く行かない
20以上50.00%50.00%100.00%
20未満30.00%70.00%100.00%
36.67%63.33%100.00%
列方向の比率
投票に行く行かない
20以上45.45%26.32%33.33%
20未満54.55%73.68%66.67%
100.00%100.00%100.00%
全体に対する比率
投票に行く行かない
20以上16.67%16.67%33.33%
20未満20.00%46.67%66.67%
36.67%63.33%100.00%

今回は居住地域別クラスターで支持政党がどう違うか、を知りたいので、行方向の比率を計算する。

観測値(現住所*支持政党)
GHIJK
10ConserativeunaffiliatedDemocratic
11Cammell=H2/$K219.51%68.29%100.00%
12Morn40.63%33.33%26.04%100.00%
13Magnol41.38%29.80%28.74%100.00%
14Angerem34.07%27.47%38.46%100.00%
15Juic22.22%45.83%31.94%100.00%
16Beyond25.00%45.83%29.17%100.00%
1730.00%33.00%37.00%100.00%

現住所ごとの支持政党率が分かる。

グラフ作成

居住地域(現住所)ごとの支持政党の傾向が分かるようなグラフを作成する。比率ベースなので横帯グラフにする。

行比率(現住所*支持政党)
GHIJK
10ConserativeunaffiliatedDemocratic
11Cammell12.20%19.51%68.29%100.00%
12Morn40.63%33.33%26.04%100.00%
13Magnol41.38%29.80%28.74%100.00%
14Angerem34.07%27.47%38.46%100.00%
15Juic22.22%45.83%31.94%100.00%
16Beyond25.00%45.83%29.17%100.00%
1730.00%33.00%37.00%100.00%
現住所ごとの支持政党比率
住所ごとの支持政党比率を示す横帯グラフ

Cammell府在住者は民主党Democratic支持傾向が強いことがうかがえる。