社会調査情報処理実習A 2組

2017年度 後期 木04 15:15-16:45 瀬田2-119

SPSS データの読み込み

SPSSはデータ入力機能が貧弱なため、Excelなどでデータ入力をして、それを後から読み込むことが多い。その際「データを開く」画面から「ファイルの種類」を変更する必要がある。

データを開く

Excelで作ったデータファイルはExcel独自ファイルか、csv形式ファイルである。またネットなどで入手可能なデータもこの両者のどちらかである事が多い。

ここではcsv形式ファイルの読み込みを行う。

※csv形式とはカンマ区切りで作られたテキストファイルである。Excelに読み込ませれば表として読み込みが可能である。またExcelからcsv形式に保存することも出来る。

表形式のデータとしてはもっとも汎用性の高い形式の一つである。

csv形式ファイルを読み込む

SPSSもcsvファイルを読み込むことが出来る。その際の手順は少し長いが、ほとんど一連の流れ作業である。

データを開く

csv形式のテキストファイルを読み込むときにはそのテキストファイルの文字エンコードに注意する必要がある。Excelで作られたファイルはUTF-8ではない。そのときにはエンコードは「ローカルエンコード」にしてから読み込みを開始する。

エンコードの選択
インポートウィザード1/6

ここはこのまま「次へ」

インポートウィザード2/6><p>csvはカンマで区切られた自由書式である。</p><p>先頭行は項目名=変数名になるようにデータは入力されているべきである。</p></figure>
<figure><img src=

ここは初期状態で「次へ」

インポートウィザード4/6

csv形式ファイルの区切り文字は「カンマ」。

インポートウィザード5/6

データ形式は「数値」「文字列」など。今回はすべて「数値」。

データ読み込み完了後のデータエディタ画面・データビュー

無事読み込み完了。

変数の設定

Excelと異なり画面下の「タブ」は同じデータの見せ方を切り替えるためのもの。

  • データビュー-入力されている値が確認できる。
  • 変数ビュー-各項目(変数)の定義が確認できる。

読み込み完了後、分析を行う前に、必ず「変数ビュー」に切り替えて、確認作業を行う。

変数ビュー

チェックすべきは主として3点

  • 型-数値、文字列が適切に指定されているか?
  • 欠損値-最初は「なし」。次の作業で設定する。
  • 尺度-「スケール」「順序」「名義」より選ぶ。
    スケールとは比例尺度と間隔尺度をあわせたもの。今回の例では「years」築年数は比例尺度であるため、「名義」を「スケール」に変更する。

欠損値

欠損値がどう入力されているかはケースバイケース。数値型データに対して欠損値に「NA」など文字列を使うとSPSS他多くのソフトウェアでは問題が出るので、あり得ない数値(今回の例では99999)を入力してあることが多い。

変数ビュー

このまま分析すると結果が大きく狂うため、「99999」を欠損値として指定する。

欠損値設定後の変数ビュー

「データビュー」に戻って、データ読み込み完了。

欠損値指定前
ABCD
119999934
299999234
312999994
41234
519999934
612399999
欠損値指定後
ABCD
11NA34
2NA234
312NA4
41234
51NA34
6123NA

A,B,Cで一つの分析にかける。

分析をする際に「ペアごとに除外」(pairewise)と「リストごとに除外」(listwise)を選択する(初期は「ペアごとに除外」)。

pairewise A-B
ABCD
1-NA34
2NA-34
312NA4
41234
5-NA34
6123NA
pairewise B-C
ABCD
11NA-4
2NA234
31-NA4
41234
51NA-4
6123NA
pairewise C-A
ABCD
11NA34
2NA2-4
3-2NA4
41234
51NA34
6123NA
listwise
ABCD
1-NA-4
2NA--4
3--NA4
41234
5-NA-4
6123NA

保存

「名前を付けてデータを保存」から分かりやすいファイル名を付けて「SPSS Statistics(*.sav)」で保存しておくと次からこのファイルをダブルクリックするだけでデータの読み込みが完了する。