Excelで学ぶ統計講座(初級)

F検定

本章で用いる実習用ファイル

母分散の比較

B大学の学生の中から500人を無作為抽出を行い、スマートフォン利用時間について調べたデータからスマートフォン利用時間に関するジェンダーによる分散の違いを知りたい。

下記データより、B大学の男子学生と女子学生との間にスマートフォン利用時間で分散に差があると言えるか。

ABCDEFGHIJ
1Nogenderfacultytime偏差平方malefemale
21femalescience193309.13N244256
32femalelaw16688.70df243255
43malescience2939261.70mean196.76175.42
54femaleliterature135332.61u22739.003475.26
μ国B大学スマートフォン利用時間調査データ
変数
gender(名義尺度)
B2:B501
time(比例尺度)
D2:D501
SDM(比例尺度)
E2:E501

分散の定義を改めて確認するため、偏差平方和と自由度から分散を計算してみる。

GHIJK
7F検定
8グループ平方和自由度分散
9male=SUM(IF(gender=G9,SDM))=COUNT(IF(gender=G9,1))-1=H9/I9
10female

F分布

二つのグループの分散は比率で比較する。

GJK
8グループ分散F
9male2739.00=J9/J10
10female3475.26
F(分散比) ← グループ1の分散 / グループ2の分散

平均差の時には二つのグループが一致したときは0となるが、二つのグループの分散が等しい時はF = 1となる。

この分散比Fを検定統計量とする確率分布はχ2分布由来のF分布である。F分布は各々のグループの自由度により形が変わる。

自由度が二つとも1,2,5のF分布

さらに自由度を増やすと

自由度が二つとも30のF分布

自由度が大きくなればF分布は正規分布に近似する。

F検定

F分布におけるF値の確率分布
  • グループ1の分散がグループ2の分散より小さい値を取る確率(青色のついた部分の面積)をp値(F<1)とする。このp値が有意水準より小さいとき、「グループ1の分散<グループ2の分散」と言える(片側検定)。
  • グループ1の分散がグループ2の分散より大きい値を取る確率(青色のついていない部分の面積)をp値(F>1)とする。このp値が有意水準より小さいとき、「グループ1の分散>グループ2の分散」と言える(片側検定)。
  • グループ1の分散がグループ2の分散と異なる値を持つ確率(青色のついた部分の面積×2)をp値(F≠1)とする。このp値が有意水準より小さいとき、「グループ1の分散≠グループ2の分散」と言える(両側検定)。
IKLMN
8自由度Fp(F!=1)p(F>1)p(F<1)
92430.79=MIN(M9,N9)*2=1-F.DIST(K9,I9,I10,TRUE)=F.DIST(K9,I9,I10,TRUE)
10255