社会調査情報処理実習A 2組

2017年度 後期 木04 15:15-16:45 瀬田2-119

Syllabus

講義概要/Course outline

学術分野のみならず、ビジネス分野においてもデータ分析の需要が高まっており、そうした需要に応えるべくコンピュータを用いたデータ分析手法を身につけていることには大きな意義がある。

本実習は今後本格的にデータ分析を行うために専門ソフトウェアを利用していく際の導入となることを目的とする。こうしたソフトウェアは完全に自学自習するのは難しいが、一度触れておけば今後学習を進めていく上での障壁は大幅に低くなる。この機会に学習することを強くお勧めする。

本実習で取り扱うデータ分析用ソフトウェアはExcel、SPSS、Rである。各ソフトウェアの特性の違いを踏まえ、段階的に高度なデータ分析を行えるように配慮する。

到達目標/Attainment objectives

ソフトウェアを用いたデータ分析の基本的な技術を習得する。

  • データ分析用のソフトウェアの特性を理解し、各ソフトウェアの基本的な操作ができるようになる。
  • データに応じて適切な分析手法を柔軟に選択できるようになる。
  • 分析結果から結局何が言えるのか、結果を読み取る力を身につける。

講義内容

データ分析概要とソフトウェア(09/21)

到達目標
  • 社会調査全般のなかでの本実習のカバレッジを把握する。
  • 統計で用いられるデータの種類を理解する。
  • 統計データを処理できるソフトウェアの特性を理解する。
  • 「欠損値」についての考え方を知る。
  • SPSSの基本操作を行う。
本実習の位置付け

社会調査士のカリキュラムにおける「B」「C」「D」の内容をコンピュータを用いて実践する。

社会調査
  • 量的調査と質的調査
  • 全数調査と標本調査
  • 量的データ・質的データ
  • 記述統計と推測統計
統計データを処理できるソフトウェア
  • Excel
  • SPSS
  • R
SPSSを使ってみる
欠損値
  • 値の置き換え
  • NAの扱い
資料・課題

データ分析用ソフトウェアの基本操作(09/28)

到達目標
  • Rの操作体系を理解する。
R入門

記述統計1(10/05)

到達目標
  • 基本統計量を算出できるようになる。
  • 各統計量の意味や特性を理解する。
  • データの概略を可視化する意義を理解する。
  • 度数分布表を作成できるようになる。
基本統計量
  • 代表値
  • 最大値・最小値
  • 範囲
ヒストグラム
  • 区切り幅
  • 度数
資料・課題

記述統計2(10/12)

到達目標
  • 「分散」という概念の意義や重要性を理解する。
基本統計量2
  • 散布度
  • 分散
  • 標準偏差

記述統計3(10/19)

到達目標
  • 箱ひげ図が読めるようになる。
  • 重み付きデータを処理できる。
箱ひげ図
  • 五数要約(最小値,第1四分位点,中央値,第3四分位点,最大値)
  • 平均値と外れ値
重み付きデータ
  • 加重平均
  • 元データの復元
資料・課題

記述統計4(10/26)

到達目標
  • SPSSで記述統計を行う
SPSSで記述統計

記述統計5(11/02)

到達目標
  • Rで記述統計を行う
Rで記述統計

推測統計:平均値に関する検定(11/09)

到達目標
  • 推測統計の基本的な考え方を理解する。
  • 「不偏分散」「自由度」という概念の意義を理解する。
  • 母平均に関する検定について、正規分布を元に理解する。
  • 母平均に関する区間推定とZ検定を行えるようになる。
推測統計と検定
分析手法
  • 平均値に関する分析
  • 分散に関する分析
  • 複数の変数の関係
平均に関する論証1
  • 平均値と分布
  • Z検定

推測統計:平均値に関する検定(11/16)

到達目標
  • t検定を行えるようになる。
  • 「効果量」という概念の意義を理解する。
平均に関する論証1

グループ間で平均に差はあるのか1(二標本のt検定)(11/30)

到達目標
  • 2グループ間の平均の差の検定の基本的な考え方を理解する。
2グループ間の平均の差の検定

グループ間で平均に差はあるのか2(二標本のt検定)(12/07)

到達目標
  • 複数の分析手法の特質の違いとその都度の適用の方針を理解する。
平均に関する論証2
  • 「頑健性(ロバスト)」
  • Welchのt検定
SPSSを用いたt検定

グループ間で平均に差はあるのか3(一元配置の分散分析)(12/14)

到達目標
  • 分散分析の基本的な考え方を理解する。
  • 実践的な場面で分散分析を行えるようになる。
分散分析概要
一元配置の分散分析
  • Studentのt検定との異同
  • 因子による分散と残差による分散
  • 分散比Fとその分布(F分布)
  • F(片側)検定
  • 3グループ以上の平均差の検定
  • 効果量η2
  • Welch修正(平均値同等性の耐久検定)
平均値に関する論証3

グループ間で選好に違いはあるのか(クロス集計とその検定)(12/21)

到達目標
  • クロス集計を行えるようになる。
  • χ2検定の概要を理解する。
  • クロス集計表から何が読み取れるのかを明確に記述できるようになる
クロス集計表の作成
  • 度数
  • 周辺度数
グラフ表現
  • 比率計算
  • 帯グラフ
クロス集計表の独立性の検定
  • ノンパラメトリック検定
  • 実測値・理論値・残差
  • Χ2検定
連関係数(効果量)
  • φ係数
  • クラメールの連関係数
残差分析
  • 調整済み残差
  • Z検定

データ間の関連モデルを作る(相関係数と回帰分析)(01/11)

到達目標
  • 散布図と相関係数の関係を理解する。
  • 相関行列を用いて知見を得られるようになる。
  • (単)回帰分析の概要を理解する。
2変数の関係とグラフ表現
  • 散布図と近似直線
  • 正の相関と負の相関
  • 因果関係と相関関係
関係の強度(効果量)を表す相関係数
  • 共分散
  • 相関係数
  • 決定係数
相関係数の有意性検定
  • 自由度
  • 標準誤差
  • 検定統計量
  • t検定
単回帰分析
  • 最小二乗法
  • 回帰直線
回帰分析の有意性

複数の要因の絡まりを解きほぐす(重回帰分析)(01/18)

到達目標
  • 重回帰分析の概要を理解する。
  • ダミー変数の扱い方を理解する。
  • 重回帰分析におけるモデル選択の手法を理解する。
  • 偏相関係数の読み取り方を理解する。
  • 疑似相関を理解する。
重回帰分析
疑似相関
  • 疑似相関
  • 偏相関係数

使用ツール・参考サイト

参考文献