社会調査情報処理実習A 2組

2017年度 後期 木04 15:15-16:45 瀬田2-119

平均に関する論証:グループ間の比較

例題

B大学の学生の中から500人を無作為抽出を行い、スマートフォン利用時間について調べたデータからスマートフォン利用時間に関するジェンダー差を知りたい。

下記データより、B大学の学生のスマートフォン利用時間について、男子学生と女子学生の違いについてデータから得られる知見を述べよ。

μ国B大学スマートフォン利用時間調査データ

問1

データより男女別の平均値を算出し、棒グラフで比較せよ。

Rスクリプト例-1
#分析用スクリプトの読み込み
source("http://kyoto-edu.sakura.ne.jp/weblesson/statistics/socialStatisticsBasic.R", encoding="UTF-8")

#データの読み込み
dataB <- read.csv("http://kyoto-edu.sakura.ne.jp/weblesson/statistics/data/smartphone00-B.csv", fileEncoding = "utf-8")

#読み込みデータ概要確認
summary(dataB)

#変数指定
time.B <- dataB$time
gender <- dataB$gender

#男女別平均利用時間
print(mean.result <- tapply(time.B,gender,mean))

#棒グラフ
barplot(mean.result,xlim=c(0,200),horiz=T)
結果出力例-1
  female     male 
175.4180 196.7623 

問2

  1. 結果より、男女に差があると言えるのか、統計的手法(独立したサンプルのt検定)を用いて検証せよ。
  2. 効果量rを求め、平均差の意義を確認せよ。
  3. 差に意義があるとすれば、統計的結果に基づき「記述・推測的解釈」を行え。
  4. 「記述・推測的解釈」を元に、問題文の文脈を加えて、「批評的解釈」を行え。

※独立したサンプルのt検定の中でも、より頑健(ロバスト)Welch検定を用いる。

Rスクリプト例-2
#Welchのt検定
print(output.t.test.independent_time <- t.test.independent(time.B,gender))

#ファイルへの書き出し
write.output(output.t.test.independent_time,"output.t.test.independent_time.csv")
結果出力例-2
$statistics
                  female       male
N             256.000000 244.000000
mean          175.417969 196.762295
u              58.951302  52.335504
SE              3.684456   3.350437
Missing value   0.000000   0.000000

$test.result
                 t-test
t         -4.285988e+00
df         4.955251e+02
p(!=)      2.186824e-05
p(>)       9.999891e-01
p(<)       1.093412e-05
mean diff -2.134433e+01
SE         4.980025e+00
Upper     -1.155976e+01
Lower     -3.112889e+01
d         -3.823699e-01
r          1.890662e-01
主張テンプレート

B大学学生のスマートフォン利用時間調査より、平均利用時間は男子学生196.76分、女子学生175.41分であった。

図表1 B大学学生男女別スマートフォン利用時間
女子学生男子学生
平均値175.41196.76

男子学生と女子学生の平均利用時間に差があるかどうかをWelchのt検定(両側)を用いて検証したところ、5%の危険度で有意であると確認できた(t(◆)=●, p<.05,r=▲)。

この検定結果を踏まえて、図表1より、…(以下、批評的解釈に基づく主張)。


  • ◆…自由度
  • ●…t値
  • ▲…効果量

課題

μ国公立高校では特進コースと一般コースを設置している。公立高校においては高校間よりもコース間によって学力差があるとされている。

全国公立高校の生徒から無作為に200人を抽出し、統一学力試験(100点満点)を行った。本試験は国立大学共通入学テストに準じた内容となっている。この結果から、μ国公立高校の受験学力について、どのような知見が得られるか、述べよ。

μ国高校生コース別統一学力試験結果データ

Rスクリプト例
#データの読み込み
data <- read.csv("http://kyoto-edu.sakura.ne.jp/weblesson/statistics/data/english-score.csv", fileEncoding = "utf-8")

#読み込みデータ概要確認
summary(data)

#変数指定
score <- data$■■
class <- data$■■

#クラス別平均点
print(mean.result <- tapply(score,class,mean))

#棒グラフ
barplot(mean.result,xlim=c(0,100),horiz=T)

#Welchのt検定
print(output.t.test.independent_score <- t.test.independent(score,class))

#ファイルへの書き出し
write.output(output.t.test.independent_score,"output.t.test.independent_score.csv")