Rによる一元配置要因分散分析
所属メンバーが異なっている3集団以上の平均の比較を行いたいときにはt検定は用いることが出来ない。その場合は一元配置分散分析を行う。
μ国B大学スマートフォン利用時間調査データ(架空データ)を用いる。
B大学の学生の中から500人を無作為抽出を行い、スマートフォン利用時間について調べたデータからスマートフォン利用時間に関する学部差を知りたい。
下記データより、B大学の学生のスマートフォン利用時間について、学部間の違いについてデータから得られる知見を述べよ。
一元配置の分散分析を行う。その際、等分散性に対して頑健性が高いとされているWelch法(「平均値同等性の耐久検定」)を用いる。
またどのグループの平均差が有意なのかも調べる(多重比較)。多重比較には様々な手法があるが、その中で頑健性が高いとされているGames-Howell法を用いる(有名なのはTukeyだが、これは等分散性を前提とした分析である)。Games-Howel法は2グループ比較にWelch検定のロジックを用いているので、分散分析のWelch法とも整合している。
Rスクリプト
oneway.factorial.anova関数(socialStatisticsBasic.Rで読み込まれる自作関数)
- oneway.factorial.anova(formula,data,boxplot=bool,col=col)
-
- formula=「従属変数(検定変数)~因子(グループ化変数)」
- data=モデル中の変数を含むデータフレーム(formulaが実体を持つ時は省略可)
- bool=箱ひげ図を出力するか(TRUE/FALSE 初期値はFALSE)
- col=棒の色(省略時はdarkorange)
multiple.comparison.test関数(socialStatisticsBasic.Rで読み込まれる自作関数)
- multiple.comparison.test(formula,data,method=method,summary=bool)
-
- formula=「従属変数(検定変数)~因子(グループ化変数)」
- data=モデル中の変数を含むデータフレーム(formulaが実体を持つ時は省略可)
- method=比較の方法("Games-Howell","Tukey","bonferroni","holm","BH")。
- bool=概要を出力するか(TRUE/FALSE 省略時はTRUE)
出力結果
一元配置分散分析
- 一元配置分散分析(Welch)
- F 8.403800
- df1 5
- df2 189.7389
- p 0.00
- 効果量
- η2 0.06533528
多重比較(Games-Howell法)
多重比較で有意なのは「経済学部」vs「理工学部」・「法学部」vs「理工学部」・「文学部」vs「理工学部」。
考察例
学部の違いによりスマートフォン利用時間に差があるかどうかを一元配置要因分散分析を用いて検証を行った。学部別の平均利用時間は以下の通りである。
agriculture | economy | law | literature | science | social |
---|---|---|---|---|---|
194.70 | 178.36 | 169.44 | 171.36 | 205.32 | 180.85 |
Welchの修正分散分析より、5%水準で有意差が見られた(F(5,189.74)=8.40, p<.05, η2=0.07)。
この結果より学部の違いによりスマートフォンの利用時間に差があると言える。
Games-Howell法により多重比較検定を行ったところ、「経済学部」vs「理工学部」(t(219.83)=5.14, p<.05)・「法学部」vs「理工学部」(t(221.66)=6.00, p<.05)・「文学部」vs「理工学部」(t(133.46)=3.77, p<.05)の間に有意差が見られた。