クロス集計と比率
- 本章で用いる実習用ファイル
μ国で有権者を対象に政治意識調査を行った。調査は無作為抽出で対象者を選び、500人から回答を得られた。
- 問1 あなたの性自認(Gender)は何ですか。
-
- 男性(male)
- 女性(female)
- 問2 あなたの住所登録がなされている府(Prefecture)はどこですか。
-
- Morn
- Angerm
- Juic
- Magnol
- Camell
- Beyond
- 問3 あなたの支持政党(Party)は何党ですか。
-
- 保守党(Conservative)
- 民主党(Democratic)
- 特になし(unaffiliated)
- 問4 あなたは現内閣を支持(CabinetSupport)しますか。
-
- 支持する(Yes)
- 支持しない(No)
この調査から得られた下記データより、現住所(Prefecture)と支持政党(Party)との関連に付いて得られる知見を述べよ。
A | B | C | D | E | F | |
---|---|---|---|---|---|---|
1 | No | Gender | Prefectures | Party | CabinetSupport | |
2 | 1 | female | Camell | unaffiliated | No | |
3 | 2 | female | Morn | unaffiliated | No | |
4 | 3 | male | Magnol | unaffiliated | Yes | |
5 | 4 | male | Angerem | unaffiliated | No | |
6 | 5 | female | Magnol | unaffiliated | Yes | |
7 | 6 | male | Morn | Conservative | Yes | |
8 | 7 | male | Camell | Democratic | No | |
μ国政治意識調査 |
クロス集計
まずはデータより現住所と支持政党に関するクロス集計を行う。この集計表は実際に観測して得られた値、観測値(実測値)によるクロス集計表(分割表)である。
G | H | I | J | K | |||
---|---|---|---|---|---|---|---|
1 | Conserative | unaffiliated | Democratic | 計 | |||
2 | Cammell | 10 | 16 | 56 | 82 | ||
3 | Morn | 39 | 32 | 25 | 96 | ||
4 | Magnol | 36 | 26 | 25 | 87 | ||
5 | Angerem | 31 | 25 | 35 | 91 | ||
6 | Juic | 16 | 33 | 23 | 72 | ||
7 | Beyond | 18 | 33 | 21 | 72 | ||
8 | 計 | 150 | 165 | 185 | 500 | ||
クロス集計表は行数と列数で大きさを表現する。このクロス集計表は5行3列のクロス集計表である。
M | N | O | P | |||
---|---|---|---|---|---|---|
1 | Yes | No | 計 | |||
2 | male | 124 | 120 | 244 | ||
3 | female | 107 | 149 | 256 | 4 | 計 | 231 | 269 | 500 |
性自認*内閣支持のクロス集計表は2行2列のクロス集計表となる。
比率計算
この調査で見たいのは現住所(居住地域)で政治的意識がどのような違いが出るか、である。このように属性的なものと意識・行動との関連を見るときにクロス集計表は用いられる。
しかし属性によるカテゴリーのサンプルサイズが異なれば、その意識・行動の違いを観測値ベースで比較してもあまり意味がない。
投票に行く | 行かない | 計 | |
---|---|---|---|
20以上 | 25 | 25 | 50 |
20未満 | 30 | 70 | 100 |
計 | 55 | 95 | 150 |
このようなクロス表が得られたとして、20未満の学生は20以上の学生より投票に行く傾向がある、という解釈は端的に間違っている。投票に行くとしているのが、20以上の学生は50%に対して、20未満の学生は30%に過ぎない。つまり比率で比較しなければならない。
というわけで比率計算を行う。
比率計算(部分/全体)は分母となる基準値をどこに置くかによって3種類ある。一般的にクロス集計表で欲しい比率は属性ごとの比率なので、属性を行側に置けば「行方向の比率」を用いる。
投票に行く | 行かない | 計 | |
---|---|---|---|
20以上 | 50.00% | 50.00% | 100.00% |
20未満 | 30.00% | 70.00% | 100.00% |
計 | 36.67% | 63.33% | 100.00% |
投票に行く | 行かない | 計 | |
---|---|---|---|
20以上 | 45.45% | 26.32% | 33.33% |
20未満 | 54.55% | 73.68% | 66.67% |
計 | 100.00% | 100.00% | 100.00% |
投票に行く | 行かない | 計 | |
---|---|---|---|
20以上 | 16.67% | 16.67% | 33.33% |
20未満 | 20.00% | 46.67% | 66.67% |
計 | 36.67% | 63.33% | 100.00% |
今回は居住地域別クラスターで支持政党がどう違うか、を知りたいので、行方向の比率を計算する。
G | H | I | J | K | |||
---|---|---|---|---|---|---|---|
10 | Conserative | unaffiliated | Democratic | 計 | |||
11 | Cammell | =H2/$K2 | 19.51% | 68.29% | 100.00% | ||
12 | Morn | 40.63% | 33.33% | 26.04% | 100.00% | ||
13 | Magnol | 41.38% | 29.80% | 28.74% | 100.00% | ||
14 | Angerem | 34.07% | 27.47% | 38.46% | 100.00% | ||
15 | Juic | 22.22% | 45.83% | 31.94% | 100.00% | ||
16 | Beyond | 25.00% | 45.83% | 29.17% | 100.00% | ||
17 | 計 | 30.00% | 33.00% | 37.00% | 100.00% | ||
現住所ごとの支持政党率が分かる。
グラフ作成
居住地域(現住所)ごとの支持政党の傾向が分かるようなグラフを作成する。比率ベースなので横帯グラフにする。
G | H | I | J | K | |||
---|---|---|---|---|---|---|---|
10 | Conserative | unaffiliated | Democratic | 計 | |||
11 | Cammell | 12.20% | 19.51% | 68.29% | 100.00% | ||
12 | Morn | 40.63% | 33.33% | 26.04% | 100.00% | ||
13 | Magnol | 41.38% | 29.80% | 28.74% | 100.00% | ||
14 | Angerem | 34.07% | 27.47% | 38.46% | 100.00% | ||
15 | Juic | 22.22% | 45.83% | 31.94% | 100.00% | ||
16 | Beyond | 25.00% | 45.83% | 29.17% | 100.00% | ||
17 | 計 | 30.00% | 33.00% | 37.00% | 100.00% | ||
Cammell府在住者は民主党Democratic支持傾向が強いことがうかがえる。