統計講座

SPSS 回帰分析

回帰分析とはある一つの量的変数(結果変数)の値について、一つないしは複数の変数(説明変数)との関係をモデル化する分析手法である。

線型モデルにおいては近似直線の性質、主に傾きから説明(独立)変数と結果(従属)変数の関係を見る。

被験者諸属性と試験結果(架空データ)を用いる。

ある集団から無作為に選んだ326人に学力テストを行い、その点数を記録し、さらに受験者のさまざまな属性と合わせて結果を分析する。得点と身長・年齢・性別の関係について回帰分析を行う。

ダミー変数

重回帰分析

結果

年齢・性別を説明変数とする得点に対する重回帰式

y(得点) = -4.292 + 6.655*x1(年齢) + -1.847*x2(性別.男)

回帰分析シンタックス

*回帰分析.
REGRESSION 
  /MISSING LISTWISE 
  /STATISTICS COEFF OUTS R ANOVA COLLIN TOL 
  /CRITERIA=PIN(.05) POUT(.10) 
  /NOORIGIN 
  /DEPENDENT marks 
  /METHOD=STEPWISE height age gender.male.

考察例

「得点」を結果変数、「年齢」「身長」「性別」を説明変数とする重回帰分析を行った。

「性別」は男性を1，女性を0とするダミー変数とした上で説明変数に投入し、ステップワイズ法で最適モデルの選択を行った。

説明変数を「年齢」のみとするモデルと「年齢」「性別」とするモデルが候補としてあげられたが、「調整済みR2乗」より「年齢」「性別」モデルを採択した。今回はモデルは複雑であってもなるべく多くの要因の影響をモデル化することを優先した。

重回帰分析の結果は分散分析よりF(2,323)=3763.30,p<.001で有意であった。

偏回帰係数は「年齢」が6.655、「性別(男性)」が-1.847でいずれも有意である。これより年齢が1歳上がれば6.655点上昇し、また男性より女性の方が1.847点高くなる傾向が見られた。