社会調査情報処理実習1

2016年度 後期 木04 15:15-16:45 瀬田1-608

Syllabus

講義概要/Course outline

学術的な場だけでなく、ビジネスの現場でも数値を根拠(エビデンス)とした状況分析・意志決定が重要視される。そのために用いる強力な武器が「統計」である。本実習では基本的な統計学をベースにしたデータ分析手法を取り扱う。

表計算ソフトExcelを主として用いる。あえてプリミティブなツールを用いることにより、各統計処理がいったい何を行っているのか、その意味を実感しつつ学習を進められるようにする。「中身が良くよく分からない」数値を機械的に求めて、後付けで解釈する、といった学習から脱却することを目指す。

SPSS・Rも適宜用い、応用性・発展性を持たせ、今後のさらなる研究に繋がるようにする。

到達目標/Attainment objectives

統計に関する基本的なリテラシーを身につける。

  • 統計は何をどこまで説明できるのかを理解する。
  • さまざまな統計処理が何を行っているのか、自然言語(日本語)で説明できるようになる。
  • データに応じて適切な分析手法を柔軟に選択できるようになる。
  • 分析結果から結局何が言えるのか、結果を読み取る力を身につける。

数式も取り扱うが、あくまで目標は「自然言語(日本語)で統計を理解する」ことである。

講義内容

データの概略を知る1(基本統計量)(9/22)

到達目標
  • 社会調査全般のなかでの本実習のカバレッジを把握する。
  • 統計で用いられるデータの種類を理解する。
  • 統計データを処理できるソフトウェアの特性を理解する。
  • 基本統計量を算出できるようになる。
  • 各統計量の意味や特性を理解する。
  • 「分散」という概念の意義や重要性を理解する。
本実習の位置付け

社会調査士のカリキュラムにおける「B」「C」「D」の内容をコンピュータを用いて実践する。

社会調査
  • 量的調査と質的調査
  • 全数調査と標本調査
  • 量的データ・質的データ
  • 記述統計と推測統計
統計データを処理できるソフトウェア
  • Excel
  • SPSS
  • R
基本統計量
  • 代表値
  • 分散・標準偏差
資料・課題

データの概略を知る2(ヒストグラムと箱ひげ図)(9/29)

到達目標
  • データの概略を可視化する意義を理解する。
  • 度数分布表を作成できるようになる。
  • 箱ひげ図が読めるようになる。
ヒストグラム
  • 区切り幅
  • 度数
箱ひげ図
  • 五数要約(最小値,第1四分位点,中央値,第3四分位点,最大値)
  • 平均値と外れ値

統計ツールを用いたデータ分析1-1(記述統計に関する応用実習)(10/6)

到達目標
  • SPSSの操作体系を理解する。
SPSS入門

統計ツールを用いたデータ分析1-2(記述統計に関する応用実習)(10/13)

到達目標
  • Rの操作体系を理解する。
  • 欠損値の扱い方を知る。
  • 重み付きデータの扱い方を知る。
R入門
欠損値
重み付きデータ
  • 加重平均
  • 元データの復元
資料

仮説検定事始め1(Z検定1)(10/20)

到達目標
  • 推測統計の基本的な考え方を理解する。
  • 母平均に関する検定について、正規分布を元に理解する。
推測統計と検定
分析手法
  • 平均値に関する分析
  • 分散に関する分析
  • 複数の変数の関係
正規分布とZ検定
  • 中心極限定理と正規分布
  • 平均値の差(長さ)をその差が偶然生じる確率(面積)に変換
資料と課題

仮説検定事始め2(Z検定2)(10/27)

到達目標
  • 母平均に関する区間推定とZ検定を行えるようになる。
  • 母分散に関する検定について、χ2分布と正規分布の関係を中心に理解する。
z検定
  • 検定統計量Z値
  • p値
区間推定
  • 標準誤差
  • 信頼度
  • 棄却値
  • 信頼下限と信頼上限
χ2分布と母分散に関する検定
  • 母分散に関する検定

仮説検定事始め3(t検定)(11/10)

到達目標
  • 「効果量」という概念の意義を理解する。
  • 「不偏分散」「自由度」という概念の意義を理解する。
効果量
  • 検定統計量と効果量
t分布とt検定
資料と課題

グループ間で平均に差はあるのか1(二標本のt検定)(11/17)

到達目標
  • 2グループ間の平均の差の検定の基本的な考え方を理解する。
  • 複数の分析手法の特質の違いとその都度の適用の方針を理解する。
2グループ間の平均の差の検定
「頑健性(ロバスト)」とは
  • Studentのt検定とWelchのt検定
  • (フィッシャーの)F検定とLevene検定
資料と課題

統計ツールを用いたデータ分析2(平均の差の検定に関する総合実習)(11/24)

到達目標
  • SPSSの操作を定着させる。
  • Rの操作を定着させる。
SPSSを用いたt検定
Rを用いたt検定

グループ間で平均に差はあるのか2(一元配置の分散分析)(12/01)

到達目標
  • 分散分析の基本的な考え方を理解する。
  • 実践的な場面で分散分析を行えるようになる。
一元配置の分散分析
  • Studentのt検定との異同
  • 因子による分散と残差による分散
  • 分散比Fとその分布(F分布)
  • F(片側)検定
  • 3グループ以上の平均差の検定
  • 効果量η2
  • Welch修正(平均値同等性の耐久検定)
SPSSを用いた一元配置の分散分析
Rを用いた一元配置の分散分析
資料と課題

グループ間で選好に違いはあるのか(クロス集計とその検定)(12/08)

到達目標
  • クロス集計を行えるようになる。
  • χ2検定の概要を理解する。
  • クロス集計表から何が読み取れるのかを明確に記述できるようになる
クロス集計表の作成
  • 度数
  • 周辺度数
グラフ表現
  • 比率計算
  • 帯グラフ
クロス集計表の独立性の検定
  • ノンパラメトリック検定
  • 実測値・理論値・残差
  • Χ2検定
連関係数(効果量)
  • φ係数
  • クラメールの連関係数
残差分析
  • 調整済み残差
  • Z検定
資料と課題

統計ツールを用いたデータ分析3(クロス集計表に関する応用実習)(12/15)

到達目標
  • クロス集計とその検定を実践する。
  • SPSSでクロス集計を行う。
  • Rでクロス集計を行う。
SPSSとRの利用

2つの事象の関係を見る(相関分析)1(12/22)

到達目標
  • 散布図と相関係数の関係を理解する。
  • 相関行列を用いて知見を得られるようになる。
2変数の関係とグラフ表現
  • 散布図と近似直線
  • 正の相関と負の相関
  • 因果関係と相関関係
関係の強度(効果量)を表す相関係数
  • 共分散
  • 相関係数
  • 決定係数
相関係数の有意性検定
  • 自由度
  • 標準誤差
  • 検定統計量
  • t検定
資料と課題

2つの事象の関係を見る(相関分析)2(1/12)

到達目標
  • 疑似相関を理解する。
疑似相関
  • 疑似相関
  • 偏相関係数

データ間の関連モデルを作る(回帰分析)(1/19)

到達目標
  • (単)回帰分析の概要を理解する。
  • 重回帰分析の概要を理解する。
  • ダミー変数の扱い方を理解する。
  • 重回帰分析におけるモデル選択の手法を理解する。
  • 偏相関係数の読み取り方を理解する。
回帰式
  • 最小二乗法
  • 回帰変動、合計変動、残差変動
  • 傾き
  • 切片
回帰分析の有意性
  • 回帰分析モデルの分散分析
  • 回帰係数のt検定
重回帰モデル
  • 偏回帰係数とその有意性
  • 標準化偏回帰係数
ダミー変数を用いた重回帰分析
  • ダミー変数
モデル選択
  • F値と変数選択
  • 自由度調整済み決定係数
  • モデル選択
資料と課題

使用ツール・参考サイト

参考文献