社会調査情報処理実習1

2015年度 後期 木03 13:30-15:00 瀬田1-608

Syllabus

講義概要/Course outline

学術的な場だけでなく、ビジネスの現場でも数値を根拠(エビデンス)とした状況分析・意志決定が重要視される。そのために用いる強力な武器が「統計」である。本実習では基本的な統計学をベースにしたデータ分析手法を取り扱う。

ツールとしては主として表計算ソフトExcelを用いる。あえてプリミティブなツールを用いることにより、各分析手法がいったい何を行っているのか、その分析の持つ意味を実感しつつ学習を進められるようにする。

到達目標/Attainment objectives

統計に関する基本的なリテラシーを身につける。

  • 統計は何をどこまで説明できるのかを把握する(統計「詐欺」に騙されないように!)。
  • 統計的にものを考える「構え」を持つ。
  • 分析結果から結局何が言えるのか、結果を読み取る力を身につける。

講義内容

データの概略を知る1(基本統計量)(9/24)

社会調査
  • 量的調査と質的調査
  • 全数調査と標本調査
  • 量的データ・質的データ
  • 記述統計と推測統計
基本統計量
資料・課題

データの概略を知る2(ヒストグラム)(10/1)

ヒストグラム
  • 区切り幅の設定
  • 度数分布表
  • ヒストグラム

データの概略を知る3(箱ひげ図)(10/8)

箱ひげ図
  • PERCENTILE関数
  • 積み上げグラフ+誤差範囲

データの概略を知る4(データの重み付けとSPSS)(10/15)

加重平均
統計ツールを用いたデータ分析1(「基本統計量とデータの分布」)
  • Excel分析ツールを用いて基本統計量を求める
  • SPSSを用いて基本統計量を求める
  • データの重み付けの扱い
資料と課題

「差」はあるといえるのか1(平均値に関する推定と検定)(10/22)

推測統計と検定
  • 帰無仮説と対立仮説
  • P値と有意水準
  • 無作為抽出
資料と課題

「差」はあるといえるのか2(平均値に関する推定と検定)(10/29)

正規分布とZ検定
  • 中心極限定理と正規分布
  • 分散、標準偏差、標準誤差
  • 検定統計量とP値
  • 片側検定と両側検定
  • 区間推定

「差」はあるといえるのか3(平均値に関する推定と検定)(11/5)

t分布とt検定
  • t分布
  • 不偏分散、自由度
効果量
  • 検定統計量と効果量
資料

「差」はあるといえるのか4(平均値に関する推定と検定)(11/12)

2グループ間の平均の差の検定
  • 正規性の検定
  • 一対の標本による平均の検定

「差」はあるといえるのか5(平均値に関する推定と検定)(11/19)

2グループ間の平均の差の検定
  • 等分散性の検定(F検定)
  • 等分散を仮定した2標本による検定(Student)
  • 分散が等しくないと仮定した2標本による検定(Welch)

「差」はあるといえるのか6(平均値に関する推定と検定)(11/26)

統計ツールを用いたデータ分析2(「平均の差の検定」)
  • Excel分析ツールを用いたF検定とt検定
  • SPSSを用いたt検定
課題

グループによって平均に差はあるのか?(一元配置の分散分析)(12/3)

平均の差の検定と分散分析
  • Studentのt検定との異同
  • 因子による分散と残差による分散
  • 分散比Fとその分布(F分布)
  • F(片側)検定
  • 3グループ以上の平均差の検定
  • 効果量η2
  • Welch修正(平均値同等性の耐久検定)
「頑健性(ロバスト)」とは
  • Studentのt検定とWelchのt検定
  • (フィッシャーの)F検定とLevene検定
  • (フィッシャーの)分散分析とWelch修正
課題

カテゴリーごとの傾向を見る1(クロス集計とその検定)(12/10)

クロス集計表の作成とグラフ表現
  • Excelピボットテーブル機能
  • 比率計算
  • 帯グラフ
クロス集計表の独立性の検定
  • ノンパラメトリック検定
  • 実測値・理論値・残差
  • Χ2検定
  • G検定(尤度比検定)
  • イェイツの連続修正
  • フィッシャーの正確確率検定
資料と課題

カテゴリーごとの傾向を見る2(効果量と残差分析)(12/17)

連関係数(効果量)
  • φ係数
  • クラメールの連関係数
残差分析
  • 調整済み残差
  • Z検定
資料と課題

2つの事象の関係を見る(相関分析と回帰分析)(01/07)

2変数の関係とグラフ表現
  • 散布図と近似直線
  • 正の相関と負の相関
  • 因果関係と相関関係
関係の強度(効果量)を表す相関係数
  • 共分散
  • 相関係数
  • 決定係数
相関係数の有意性検定
  • 自由度
  • 標準誤差
  • 検定統計量
  • t検定
資料と課題

複数の要因の絡まりを解きほぐす(相関分析・回帰分析)(1/14)

回帰式
  • 最小二乗法
  • 回帰変動、合計変動、残差変動
  • 傾き
  • 切片
回帰分析の有意性
  • 回帰分析モデルの分散分析
  • 回帰係数のt検定
重回帰モデル
  • 偏回帰係数とその有意性
  • 標準化偏回帰係数
  • ダミー変数を用いた重回帰分析
  • F値と変数選択
  • 自由度調整済み決定係数
  • モデル選択
複数の要因の絡み合い
  • 疑似相関
  • 偏相関係数
  • 偏回帰係数の読み取りとモデル選択
資料と課題

成績評価

評価基準

平常点+最終課題

平常点
  • 各回提出物(5回以上の未提出で平常点はなし)
最終課題
  • 度数分布表・平均の差の検定・分散分析・クロス集計・相関・重回帰分析
  1. 最終課題(100点)
  2. 平常点(100点)+最終課題ボーナス点(40点ただし100点以上は切り捨て)

A,Bいずれかの評価点のうち、点数の高いものを最終的な成績評価とする。

最終課題

問題ファイル

提出締切は2016年1月21日。各個人の「提出」フォルダに提出のこと。

使用ツール・参考サイト

参考文献