社会調査情報処理実習A 2組

2017年度 後期 木04 15:15-16:45 瀬田2-119

片側検定か両側検定か

検定を行う際、片側検定を使うのか、両側検定を使うのかは存外なやましい問題である。とりわけ二集団の平均の差の検定を行う時には、なにが調査の目的なのか、その文脈を明確にしないと判断が定まらないものである。多くの統計の教科書はこの辺りの説明を軽視しているように思う。

調査・分析者にとって、片側検定のほうが有利な結果が得られる。

まずはこの原則をしっかり踏まえよう。世の中、一方的に有利な手段を選べるわけではない(それで良いのなら不利な手段は不要なのだ)。となると、有利な片側検定を採用しようとすると、何かしらそれに対する負荷が掛かるのである。それが何か。そこをしっかり理解しよう。

ある指標に関して「集団Aのほうが集団Bよりも平均値が高い」という仮説を検証するときに用いる検定は片側検定か両側検定か。

この問をそれだけで完結したものとして提示されればもちろん解答は「片側検定」である。しかしそもそもの仮説「集団Aのほうが集団Bよりも平均値が高い」が調査目的に照らして仮説として妥当かどうかが問題なのである。

なぜ「Aの方がBよりも高い」という一方向の仮説を設定したのか?「Bの方がAよりも高い」という可能性はなぜ考慮に入れなくとも良いのか?それを明確に説明できないと仮説設定そのものの妥当性が問われることになる。

たとえば「標本の平均値を見てみたらAの標本平均がBの標本平均よりも値が大きかったから」という回答は説明になっていない。今検証を行っているデータを根拠に仮説を設定してはならないのだ。このケースでは平均の差を論じることの有意性を両側検定を用いて検証し、統計的に有意であれば、データから得られた結果を基に「Aの方がBよりも高い」と議論を進める。

「一般的に(社会常識的に)Aの方がBよりも平均が高いといわれているから」。その常識が統計的に裏付られるかどうかを検証したいという目的であれば片側検定ということになる。しかし常識は常識として、実際の所はどうなのか、を検証したいという目的であれば両側検定を用いなければならない。仮に標本から「Bの方がAよりも高い」という結果が得られたとしたら、それも検出しなければならないからだ(社会学的にはむしろそちらの方が興味深いではないか!)。

実は片側検定が有効に用いられるケースは多くの教科書の説明よりもずっと限られたものなのである。A>Bという仮説を片側検定で検証できるのはデータからA<Bという結果が得られたとしてもその結果には意義がない場合に限られる

たとえばBが規範的な集団であり、それを上回っている時のみ検出したい(「差があるとは言えない」、「下回っている」を同じ扱いにして構わない)というケースで片側検定は有効なのである。それに対して対照的な2集団を比較したいという目的の時は両側検定を用いるのが多くの場合妥当である。

以下の事例で片側検定か両側検定、どちらを用いるべきか、考えてみよう(※ここで用いている設定およびデータはすべて架空のものである)。

A.血圧

問題1

新たに開発した降圧剤の効果を確かめるため、被験者30人に対して血圧の測定を行った。

降圧剤を服用する前の血圧の平均値は117.2、降圧剤を服用した後は113.5であった。データからこの降圧剤に血圧を下げる効果があったと言えるかどうか検証せよ。

降圧剤を使用した後、血圧の低下が有意でないとしても、逆に血圧が上がっていたとしても、その降圧剤には効果はないという結論は変わらない。血圧の低下が有意に認められない以上はもはや実験は失敗である(血圧が上がってしまった場合には別な問題が生じる可能性はあるが、それは再度問題設定をやり直す必要がある)。つまり片側検定で良い。

問題2

新たに開発した頭痛薬には副作用として血圧に影響をあたえる可能性が懸念されている。そこで被験者30人に対して血圧の測定を行った。頭痛薬を服用する前の血圧の平均値は117.2、頭痛薬を服用した後は113.5であり、服用後に血圧の低下が見られた。データからこの頭痛薬が血圧を下げる作用を持っていると言えるかどうか検証せよ。

血圧が低下する事が確認されたのはデータによってである。したがって血圧が上昇する可能性は仮説段階では無視できない。そして血圧が上昇した場合でも「血圧に影響をあたえる」と言える。つまりこのケースでは

投薬前後の血圧の変化(差)は統計的に有意かどうか―両側検定

↓(有意であるならば)

データ上の差(投薬後-投薬前)についての結果(投薬後<投薬前)を採択可

B.再犯率

問題3

ある罪を犯し、収監された者の出所後の再犯率は全国平均で20%である。特別な教育プログラムを実施しているある刑務所では、同種の罪を犯した者の再犯率は18.5%であった。この教育プログラムに再犯率を下げる効果があると言えるかどうか検証せよ。

再犯率が低下しているとは言えないか、さらには上昇しているか、どちらのケースもこの教育プログラムにポジティブな効果を主張するエビデンスにはならない。教育プログラムの意義を統計的に主張したい文脈においては片側検定を用いる。

問題4

ある罪を犯し、収監された者の出所後の再犯率は全国平均で20%である。ある刑務所で同種の罪を犯した者の再犯率は18.5%であった。もしこの刑務所の再犯率が全国の再犯率よりも低いと言えるのであれば、この刑務所の取り組みを調査したい。この刑務所の再犯率は全国平均よりも低いと言えるかどうか検証せよ。

再犯率が全国平均と比較して低いと言えるケースのみを取り上げ、変化が認められなかったり、高かったりするケースは捨て去って構わない。片側検定を用いる。

問題5

刑務所ごとの環境により再犯率が変化するかどうかを調査している。

ある罪を犯し、収監された者の出所後の再犯率は全国平均で20%である。ある刑務所で同種の罪を犯した者の再犯率は18.5%であった。この刑務所の再犯率は全国平均よりも低いと言えるかどうか検証せよ。

再犯率が全国平均と比較して低いケースも高いケースも「(受刑)環境と再犯率」の関係を知る上では意味がある。両側検定を用いる。

C.内閣支持率

問題6

一般的に内閣支持率は男性の方が高いと言われている。

男女の内閣支持率を調査したところ、内閣支持率は男性64%、女性61%であった。このデータから内閣支持率は男性の方が高いと言えるかどうか検証せよ。

これは悩ましい問題である。「統計学」という枠組みに限定すれば、このケースは「片側検定を用いる」という解答は間違いではない。「男性の方が内閣支持率は高い」という仮説をそれそのものとして是とするならば、それに対応する検定は男性>女性を検証する片側検定である。たとえば社会学の文脈でも「内閣支持率は男性の方が高い」という「常識」を検証したい時には片側検定が正しい。

しかし「実際のところ男女の内閣支持率はどちらが高いのか(本当に男性の方が高いのか)」を問うケースにおいては、女性の方が内閣支持率が高い(かもしれない)という可能性は見過ごすわけにはいかない。仮にあるサンプルにおいて女性の方が内閣支持率は顕著に高いという結果が出たとして、それは「有意差なし」として捨て去る事が許容されるだろうか。

女性の方が内閣支持率が高い、という(論理的にあり得べき)結果に価値を認めるのであれば、この事例は両側検定となる。データを根拠に男女の内閣支持率の差に言及する事が許されるかどうかを両側検定において検証し、有意であるならば、男性の方が女性より内閣支持率が高いというデータから得られた知見をエビデンスとして議論を進めることになる。

D.賃金

問題7

アベノミクスで経済状況は改善していると政府・自民党は喧伝しており、その根拠として賃金が上昇している事を上げている。この主張の是非を検証したい。

全国労働者5000人に対して月当たりの賃金を調査したところ、2010年28万円に対して、2015年31万円であった。このデータをアベノミクスにおける経済改善に関するエビデンスとして用いてよいかどうか検証せよ。

ここでの問題設定では賃金の状況について客観的に知見を得たいわけではない。アベノミクスに対する評価が問題とされている。

賃金に関する調査から得られた結果が2010年と2016年との差を否定するものであったとしても、あるいは2010年の方が賃金は高かったという結果であったとしても、ここでの仮説(アベノミクスで経済改善)は否定される。つまり「平均に差があると言えない」も「平均は下がった」も同じ価値を持っており、それをまとめて棄却できればそれで仮説は検証された事になる。つまり片側検定で賃金の上昇が裏付けられれば目的は達成される。