二元配置分散分析1
Excel分析ツールにある「分散分析:繰り返しのない二元配置」。本当はそんなものはない(二元配置要因分散分析で単にカテゴリ内にデータが一つしかないだけ)のだが、入門書などで見かけるので、あえて取り上げる。
大学生の自主学習時間に関する学部別学年別調査クロス集計済みデータ(架空データ)を用いる。
ある大学で学生の一日あたりの平均自習時間を調査した。学生を学部ごと、学年ごとに無作為で4人抽出し、1ヶ月の平均時間を調査し、その結果をクロス集計にまとめた。
このクロス集計表から学部・学年の違いが自習時間に影響するかどうかついて分析せよ。
自習時間に関する学部別・学年別集計表
| 経済 | 法 | 文 | 理工 | 社会 |
1回 | 121.50 | 116.50 | 113.75 | 112.25 | 115.75 |
2回 | 103.25 | 104.25 | 118.75 | 124.50 | 122.50 |
3回 | 113.75 | 112.25 | 111.00 | 112.75 | 106.25 |
4回 | 90.00 | 88.50 | 106.00 | 129.50 | 96.50 |
分析対象
アンケート調査において元データをそのまま使うのではなく、クロス集計表を分析する際に行う。本来は一回の実験でデータを集め、分析をするケースを想定している。
二つの要因偏差
基本的な考え方は一元配置分散分析と同じ。変動要因が複数。
- 個々の値 ← 全体の平均 + 要因1ごとの平均差 + 要因2ごとの平均差 + 誤差(残差)
表の形において、一元配置反復測定分散分析で残差から切り離したサンプル効果をもうひとつのカテゴリー効果と見なせば、今回の分析となる。したがって計算自体は一元配置反復測定分散分析と同じ。サンプル偏差が要因2偏差になる。
なお本来二元配置分散分析では検出可能な交互作用はこのケースでは検出できない。
二つの要因分散と残差分散
以下、一元配置反復測定分散分析と同じ計算を続ける。
F検定
二元配置要因分散分析
変動要因 | 変動 | 自由度 | 分散 | F | p |
学年 | 585.36257 | 3 | 195.12083 | 2.083465 | 0.1559275 |
学部 | 502.6750 | 4 | 125.66875 | 1.341868 | 0.3105777 |
残差 | 1123.8250 | 12 | 93.65208 | | |
データを集約してから分析をしているため、自由度が元データより減る。それだけ情報量が減っており、分析としては必ずしも有利ではない。元データを使える時に好んで用いる手法ではない。