情報処理実習3B(Web)

2019年度 前期 木04 15:15-16:45 瀬田3-B106

SPSS クロス集計

カテゴリー変数同士の関係を見る際には数を数えるというのがまずなすべきことである。複数のカテゴリー間で度数を示したものがクロス集計表である。

クロス集計表自体は単純な記述統計だが、その有意性の検証にはノンパラメトリック検定であるχ2検定を用いる。

性別の意見調査(架空データ;UTF-8)を用いる。

アンケート調査の中でAという意見に対する賛否を尋ねた。男性と女性でこの賛否動向にどのような傾向があるか。

分析手順

データ読み込み後
「分析(A)」→「記述統計(E)→「クロス集計表(C)」

「分析(A)」→「記述統計(E)→「クロス集計表(C)」。

クロス集計表

どちらを行、どちらを列にするかは文脈に依存する。

「統計量」「セル」を順に指定していく。

クロス集計表:統計量の指定
  • 「カイ2乗」でクロス集計表の独立性の検定がされる。
  • 「名義」→「PhiおよびCramerV(P)」が効果量。
クロス集計表:セル表示の設定
  • 「度数」→「観測」・「期待」
  • 「パーセンテージ」→文脈に依存する。今回は「行」に設定した性別ごとの傾向を見たいので「行(R)」。
  • 「残差」→「調整済みの標準化(A)」。

結果

結果:クロス集計表
独立性の検定…「カイ2乗検定」
「Pearsonのカイ2乗」
  • 検定統計量χ2:「値」6.510
  • 自由度df:「自由度」は1
  • p(≠):「漸近有意確率(両側)」.011
期待度数が5未満のセルが20%以上ある時には結果は信頼できない
「連続修正」(Yates)
  • 検定統計量χ2:「値」6.035
  • 自由度df:「自由度」1
  • p(≠):「漸近有意確率(両側)」.014
これが出力される時(自由度1)はこちらを採用する
「Fhisherの直接法」
  • p(≠):「正確な有意確率(両側)」.014
これが出力される時はこちらを優先するという考え方もある
効果量
Cramer'V:「対称性による類似性」の「CramerのV」「値」.118
Cramer'Vの目安
効果量V効果の目安
0.5
0.3
0.1
0なし
残差分析
「クロス表」の各セルの「調整済み残差」の符号
賛成反対
-2.62.6
2.6-2.6
絶対値が1.96より大きければ5%水準で有意

シンタックス

*クロス集計表.
*χ2検定、Phi係数.
*観測値、期待度数、行比率、調整済み残差.
CROSSTABS 
  /TABLES=性別 BY Aという意見に 
  /FORMAT=AVALUE TABLES 
  /STATISTICS=CHISQ PHI 
  /CELLS=COUNT EXPECTED ROW ASRESID 
  /COUNT ROUND CELL.

考察例

男女によってAに関して賛否動向が変わるかどうかをクロス集計表により検証を行った。

クロス集計表はχ2検定(Yates)により5%水準で有意であり(χ2(1)=6.04, p<.05, V=0.12)、男女によって賛否動向が異なっていると言える。

残差分析より、女性よりも男性の方がAに関して「賛成」と答える傾向が強い。