平均に関する論証:グループ間の比較
例題
B大学の学生の中から500人を無作為抽出を行い、スマートフォン利用時間について調べたデータからスマートフォン利用時間に関するジェンダー差を知りたい。
下記データより、B大学の学生のスマートフォン利用時間について、男子学生と女子学生の違いについてデータから得られる知見を述べよ。
問1
データより男女別の平均値を算出し、棒グラフで比較せよ。
Rスクリプト例-1
#分析用スクリプトの読み込み source("http://kyoto-edu.sakura.ne.jp/weblesson/statistics/socialStatisticsBasic.R", encoding="UTF-8") #データの読み込み dataB <- read.csv("http://kyoto-edu.sakura.ne.jp/weblesson/statistics/data/smartphone00-B.csv", fileEncoding = "utf-8") #読み込みデータ概要確認 summary(dataB) #変数指定 time.B <- dataB$time gender <- dataB$gender #男女別平均利用時間 print(mean.result <- tapply(time.B,gender,mean)) #棒グラフ barplot(mean.result,xlim=c(0,200),horiz=T)
結果出力例-1
female male 175.4180 196.7623
![](/weblesson/writing/img/bar_graph_gender.png)
問2
- 結果より、男女に差があると言えるのか、統計的手法(独立したサンプルのt検定)を用いて検証せよ。
- 効果量rを求め、平均差の意義を確認せよ。
- 差に意義があるとすれば、統計的結果に基づき「記述・推測的解釈」を行え。
- 「記述・推測的解釈」を元に、問題文の文脈を加えて、「批評的解釈」を行え。
※独立したサンプルのt検定の中でも、より頑健(ロバスト)なWelch検定を用いる。
Rスクリプト例-2
#Welchのt検定 print(output.t.test.independent_time <- t.test.independent(time.B,gender)) #ファイルへの書き出し write.output(output.t.test.independent_time,"output.t.test.independent_time.csv")
結果出力例-2
$statistics female male N 256.000000 244.000000 mean 175.417969 196.762295 u 58.951302 52.335504 SE 3.684456 3.350437 Missing value 0.000000 0.000000 $test.result t-test t -4.285988e+00 df 4.955251e+02 p(!=) 2.186824e-05 p(>) 9.999891e-01 p(<) 1.093412e-05 mean diff -2.134433e+01 SE 4.980025e+00 Upper -1.155976e+01 Lower -3.112889e+01 d -3.823699e-01 r 1.890662e-01
主張テンプレート
B大学学生のスマートフォン利用時間調査より、平均利用時間は男子学生196.76分、女子学生175.41分であった。
女子学生 | 男子学生 | |
---|---|---|
平均値 | 175.41 | 196.76 |
![](/weblesson/writing/img/bar_graph_gender.png)
男子学生と女子学生の平均利用時間に差があるかどうかをWelchのt検定(両側)を用いて検証したところ、5%の危険度で有意であると確認できた(t(◆)=●, p<.05,r=▲)。
この検定結果を踏まえて、図表1より、…(以下、批評的解釈に基づく主張)。
- ◆…自由度
- ●…t値
- ▲…効果量
課題
μ国公立高校では特進コースと一般コースを設置している。公立高校においては高校間よりもコース間によって学力差があるとされている。
全国公立高校の生徒から無作為に200人を抽出し、統一学力試験(100点満点)を行った。本試験は国立大学共通入学テストに準じた内容となっている。この結果から、μ国公立高校の受験学力について、どのような知見が得られるか、述べよ。
Rスクリプト例
#データの読み込み data <- read.csv("http://kyoto-edu.sakura.ne.jp/weblesson/statistics/data/english-score.csv", fileEncoding = "utf-8") #読み込みデータ概要確認 summary(data) #変数指定 score <- data$■■ class <- data$■■ #クラス別平均点 print(mean.result <- tapply(score,class,mean)) #棒グラフ barplot(mean.result,xlim=c(0,100),horiz=T) #Welchのt検定 print(output.t.test.independent_score <- t.test.independent(score,class)) #ファイルへの書き出し write.output(output.t.test.independent_score,"output.t.test.independent_score.csv")