基準値との比較:t検定
- 本章で用いる実習用ファイル
基準値との比較
μ国では大学生のスマートフォンの利用が勉学に悪影響を及ぼしているのではないかと社会問題化している。教育省は各大学に在籍生のスマートフォン平均利用時間が180分を有意に上回ると当該大学に指導対象とする通達を出すという。今回B大学は全学生の中から500人を無作為抽出を行い、スマートフォン利用時間について調べたところ、下記データが得られた。
A | B | C | D | E | F | G | H | ||
---|---|---|---|---|---|---|---|---|---|
1 | No | gender | faculty | time | 平均値 | ||||
2 | 1 | female | science | 193 | 基準値 | 180.00 | |||
3 | 2 | female | law | 166 | A大学 | ||||
4 | 3 | male | science | 293 | |||||
μ国B大学スマートフォン利用時間調査データ |
このデータより、B大学は教育省が定めるスマートフォン利用時間基準値180分を有意に上回っていると言えるだろうか?
基準値 | B大学 | |
---|---|---|
平均値 | 180 | 185.83 |
問題
※今回のケースでは基準値側の分散(母分散)は不明である。
- t検定を行い、有意性の確認をせよ(t値、自由度、p値)。
- 効果量rを求め、平均差の意義を確認せよ。
- ここまでで得られた知見をもとに「記述・推測的解釈」を行え。
- 問題文中の文脈を踏まえ、主張を簡潔に述べよ(「批評的解釈」)。
主張テンプレート
…トピックセンテンス(主張)…。B大学学生のスマートフォン平均利用時間(サンプル平均利用時間x)は教育省が定める基準時間(180.00)より[長い/短い](t(◆)=●, p<.05,r=▲)。補足説明文など。
- ◆…自由度
- ●…t値
- ▲…効果量
t検定
平均の差の検定であることに違いは無いので、基本的にはz検定の枠組みで行けるはず。ただ標準誤差を求めるときに使う基準値の分散が分からない。この「基準値の分散」が分からない、というところでz検定とは違う箇所が出てくる。
不偏分散u2
母分散が分からない場合(そしてそのほうが普通だろう)、母分散の代わりにその推定値を用いるしかない。
母分散の推定値は標本分散にその標本が持つ誤差を合わせることで求められる。
※標準誤差:十分な回数無作為抽出を繰り返した時の標本平均の標準偏差
ここで求められた母分散の推定値を不偏分散u2と呼ぶ(統計の世界で単に「分散」といえばこの不偏分散を指す)。
不偏分散 ← 偏差平方和/(N - 1)
※不偏分散は定義通りの分散(偏差平方和/N)よりも値が少し大きくなる。
F | G | |||
---|---|---|---|---|
8 | 分散 | =SUM((time - AVERAGE(time))^2)/(COUNT(time) - 1) | ||
この分散がExcelではVAR.S関数として用意されている。
F | G | |||
---|---|---|---|---|
8 | 分散 | =VAR.S(time) | ||
そして不偏分散を求める式の分母が自由度dfである。
自由度df
z検定ではすべての標本に加えて、基準値の分散を計算に用いる。しかし今回の検定ではすべての標本と、その標本から計算された不偏分散を用いて計算することになる。結果として使用しているデータの総数が一つ少なくなる。
一般的にあるデータ群を用いて計算を行うとき、そのデータ群から求められた別の計算結果を元の計算に投入すると、元のデータの大きさの価値は保てない。
例えば5つの数値データがあるとしよう。その5つがどのような数値であるのかは実際にデータを集めるまでは決まらない。だからその集めたデータには5つ分のデータの価値がある。しかし5つの数値データの合計が先に決まっているとしよう。そうなるともはやそのデータは5つ分の価値はなくなる。
A | B | C | D | E | F | ||
---|---|---|---|---|---|---|---|
1 | 1 | 2 | 3 | 4 | 5 | 合計 | |
2 | 10 | 5 | 2 | 3 | 25 |
合計の25という値が先に与えられていたら、1-4までの値が確定した段階で5の値も確定する。つまり5つのデータがあっても、「自由」に決められるのは4つまでである。つまりこの5つのデータの自由度は「4」となる。
今回の検定での自由度は「サンプルサイズ - 1」である。
F | G | |||
---|---|---|---|---|
5 | サンプルサイズ | 500 | ||
6 | 自由度 | =G5 - 1 | ||
t検定の計算
- 有意水準はあらかじめ定めておく(一般的には5%)。
F G 12 有意水準 5% - 平均差 = AVERAGE(time) - 基準値(180)
F G 13 平均差 =AVERAGE(time) - G2 - 標準誤差 = SQRT(標本の不偏分散 / サンプルサイズ)
F G 14 標準誤差 =SQRT(VAR.S(time)/COUNT(time)) - t値(検定統計量) = 平均差 / 標準誤差
F G 13 平均差 5.83 14 標準誤差 3.32 15 t値 =G13/G14 この検定も先のz検定と同様平均差を確率に換算する分布を用いる。ただその分布に標準正規分布は使えない。代わりにt分布を用いる。t分布は自由度によってその形を変える。自由度が十分に大きければt分布は標準正規分布と同じになる。
- 棄却値 = T.INV(1 - 有意水準/2, 自由度)
自由度dfのt分布における有意水準に対応する平均差(平均差がこの値より大きくなるとその平均差は偶然では片付けられないと見なす)。
F G 6 自由度 499 12 有意水準 5% 16 棄却値 =T.INV(1 - G12/2, G6) - p値は標本の平均値と基準値との大小に関する仮説から3つ(>, <, ≠)計算する
p値は標本の平均が基準値(帰無仮説における母平均)に対してそれだけ距離を持つ確率
- 片側検定:p値(母平均>基準値)
-
- 帰無仮説
- 母平均が基準値を上回らない。
- 片側検定:p値(母平均<基準値)
-
- 帰無仮説
- 母平均が基準値を下回らない。
- 両側検定:p値(母平均≠基準値)
-
- 帰無仮説
-
- z値>0…母平均は基準値を上回らない
- z値<0…母平均は基準値を下回らない
F G 6 自由度 499 15 t値 2.30 17 p値(≠) =(1-T.DIST(ABS(G15),G6,TRUE))*2 18 p値(>) =1-T.DIST(G15,G6,TRUE) 19 p値(<) =T.DIST(G15,G6,TRUE)
効果量
検定統計量tはサンプルの大きさによって変化する。サンプルが大きくなればt値は大きくなり、有意という結果が出やすくなる。サンプルの統計的な有意性としてはそれが良いのだが、一方その平均差が実際の母集団においてはどの程度の影響を持っているのかを見る時にはサンプルの大きさは本来無関係なはずである。このサンプルサイズに影響を受けない統計量を効果量と呼ぶ。
平均の差の検定においては効果量dと効果量rが知られている。
- 効果量d
-
平均差 / データの標準偏差
F G 9 標準偏差 56.78 13 平均差 5.83 22 効果量d =G13/G9 - 効果量r
-
sqrt(t値^2/(t値^2 + 自由度))
F G 6 自由度 499 15 t値 2.30 23 効果量r =SQRT(G15^2/(G15^2 + G6))
効果量dの絶対値 | 効果の目安 |
0.8 | 大 |
0.5 | 中 |
0.2 | 小 |
0 | なし |
効果量rの絶対値 | 効果の目安 |
0.5 | 大 |
0.3 | 中 |
0.1 | 小 |
0 | なし |
出力結果
F | G | |||
---|---|---|---|---|
5 | サンプルサイズ | 500 | ||
6 | 自由度 | 499 | ||
7 | 平均値 | 185.83 | ||
8 | 分散 | 3223.81 | ||
9 | 標準偏差 | 56.78 | ||
11 | t検定 | |||
12 | 有意水準 | 5% | ||
13 | 平均差 | 5.83 | ||
14 | 標準誤差 | 2.54 | ||
15 | t値 | 2.30 | ||
16 | 棄却値 | 1.96 | ||
17 | p値(≠) | 0.02 | ||
18 | p値(>) | 0.01 | ||
19 | p値(<) | 0.99 | ||
20 | 信頼上限 | 190.82 | ||
21 | 信頼下限 | 180.85 | ||
22 | 効果量d | 0.10 | ||
23 | 効果量r | 0.10 | ||
主張
t検定の結果から得られた知見をまとめよ。
-
B大学は教育省の指導対象とされる公算が強い。B大学学生のスマートフォン平均利用時間(サンプル平均185.83)は教育省が定める基準時間(180.00)より長い(t(499)=2.30, p<.05,r=0.10)。早急に対策を立て、教育省に説明する準備を進める必要がある。
課題(形式)
μ国内大学運動部に在籍する男子学生から500人を無作為に抽出して、走り高跳びの記録を計測したところ、下記データが得られた。教育省が定める男子運動部走り高跳びの目標記録は180cmである。
教育省の定める目標記録を踏まえて、μ国大学運動部に在籍する男子学生の走り高跳びの平均記録に関する現状について論じよ。
小レポートテンプレート:μ国学生男子運動部走り高跳びの現状
μ国では運動部所属学生の運動能力向上に資するよう、教育省が各種競技記録について目標記録を定め、随時運動部所属学生の運動能力のチェックを行っている。そのデータを用いて、μ国運動部所属学生の運動能力の現状について考察したい。今回は運動部に在籍する男子学生から500人を無作為に抽出して、走り高跳びの記録を計測したデータを用いる。
基準値 | 今回サンプル | |
---|---|---|
平均値 | 180 | ***.** |
t検定を行え
…(以下、t検定の結果に基づく記述・推測的解釈に基づく主張)。
…(以下、批評的解釈に基づく主張)。
-
μ国学生男子運動部走り高跳びの現状
μ国では運動部所属学生の運動能力向上に資するよう、教育省が各種競技記録について目標記録を定め、随時運動部所属学生の運動能力のチェックを行っている。そのデータを用いて、μ国運動部所属学生の運動能力の現状について考察したい。今回は運動部に在籍する男子学生から500人を無作為に抽出して、走り高跳びの記録を計測したデータを用いる。
表1 走り幅跳び記録 基準値 今回サンプル 平均値 180 185.64 μ国運動部所属男子学生の走り高跳び記録に関しては、大きな課題は見当たらず、順調である。μ国大学運動部に在籍する男子学生の走り高跳びの記録(サンプル平均記録185.64)は教育省が定める目標記録(180.00)を上回っている(t(499)=14.42, p<.01,r=0.54)。図1の分布より平均付近の学生への指導を充実させれば、さらに記録を伸ばすことも可能であろう。