Syllabus
講義概要/Course outline
学術分野のみならず、ビジネス分野においてもデータ分析の需要が高まっており、そうした需要に応えるべくコンピュータを用いたデータ分析手法を身につけていることには大きな意義がある。
本実習は今後本格的にデータ分析を行うために専門ソフトウェアを利用していく際の導入となることを目的とする。こうしたソフトウェアは完全に自学自習するのは難しいが、一度触れておけば今後学習を進めていく上での障壁は大幅に低くなる。この機会に学習することを強くお勧めする。
本実習で取り扱うデータ分析用ソフトウェアはExcel、SPSS、Rである。各ソフトウェアの特性の違いを踏まえ、段階的に高度なデータ分析を行えるように配慮する。
到達目標/Attainment objectives
ソフトウェアを用いたデータ分析の基本的な技術を習得する。
- データ分析用のソフトウェアの特性を理解し、各ソフトウェアの基本的な操作ができるようになる。
- データに応じて適切な分析手法を柔軟に選択できるようになる。
- 分析結果から結局何が言えるのか、結果を読み取る力を身につける。
講義内容
データ分析概要とソフトウェア(09/26)
- 到達目標
-
- 社会調査全般のなかでの本実習のカバレッジを把握する。
- 統計で用いられるデータの種類を理解する。
- 統計データを処理できるソフトウェアの特性を理解する。
- 「欠損値」についての考え方を知る。
- SPSSの基本操作を行う。
- 本実習の位置付け
-
社会調査士のカリキュラムにおける「B」「C」「D」の内容をコンピュータを用いて実践する。
- 社会調査
-
- 量的調査と質的調査
- 全数調査と標本調査
- 量的データ・質的データ
- 記述統計と推測統計
- 統計データを処理できるソフトウェア
-
- Excel
- SPSS
- R
- SPSSを使ってみる
- 欠損値
-
- 値の置き換え
- NAの扱い
- 資料・課題
データ分析用ソフトウェアの基本操作(10/03)
- 到達目標
-
- Rの操作体系を理解する。
記述統計1(10/10)
- 到達目標
-
- 基本統計量を算出できるようになる。
- 各統計量の意味や特性を理解する。
- データの概略を可視化する意義を理解する。
- 度数分布表を作成できるようになる。
- 基本統計量
-
- 代表値
- 最大値・最小値
- 範囲
- ヒストグラム
-
- 区切り幅
- 度数
- 資料・課題
記述統計2(10/17)
- 到達目標
-
- 「分散」という概念の意義や重要性を理解する。
- 基本統計量2
-
- 散布度
- 分散
- 標準偏差
記述統計3(10/24)
- 到達目標
-
- 箱ひげ図が読めるようになる。
- 重み付きデータを処理できる。
- 箱ひげ図
-
- 五数要約(最小値,第1四分位点,中央値,第3四分位点,最大値)
- 平均値と外れ値
- 重み付きデータ
-
- 加重平均
- 元データの復元
- 資料・課題
記述統計4(10/31)
- 到達目標
-
- SPSSで記述統計を行う
- SPSSで記述統計
記述統計5(11/07)
- 到達目標
-
- Rで記述統計を行う
- Rで記述統計
推測統計:平均値に関する検定(11/14)
- 到達目標
-
- 推測統計の基本的な考え方を理解する。
- 「不偏分散」「自由度」という概念の意義を理解する。
- 母平均に関する検定について、正規分布を元に理解する。
- 母平均に関する区間推定とZ検定を行えるようになる。
推測統計:平均値に関する検定(11/21)
- 到達目標
-
- t検定を行えるようになる。
- 「効果量」という概念の意義を理解する。
- 平均に関する論証1
-
- t検定
- 効果量
グループ間で平均に差はあるのか1(二標本のt検定)(11/28)
- 到達目標
-
- 2グループ間の平均の差の検定の基本的な考え方を理解する。
グループ間で平均に差はあるのか2(二標本のt検定)(12/05)
- 到達目標
-
- 複数の分析手法の特質の違いとその都度の適用の方針を理解する。
- 平均に関する論証2
-
- 「頑健性(ロバスト)」
- Welchのt検定
- SPSSを用いたt検定
グループ間で平均に差はあるのか3(一元配置の分散分析)(12/12)
- 到達目標
-
- 分散分析の基本的な考え方を理解する。
- 実践的な場面で分散分析を行えるようになる。
- 分散分析概要
- 一元配置の分散分析
-
- Studentのt検定との異同
- 因子による分散と残差による分散
- 分散比Fとその分布(F分布)
- F(片側)検定
- 3グループ以上の平均差の検定
- 効果量η2
- Welch修正(平均値同等性の耐久検定)
- 平均値に関する論証3
グループ間で選好に違いはあるのか(クロス集計とその検定)(12/19)
- 到達目標
-
- クロス集計を行えるようになる。
- χ2検定の概要を理解する。
- クロス集計表から何が読み取れるのかを明確に記述できるようになる
- クロス集計表の作成
-
- 度数
- 周辺度数
- グラフ表現
-
- 比率計算
- 帯グラフ
- クロス集計表の独立性の検定
-
- ノンパラメトリック検定
- 実測値・理論値・残差
- Χ2検定
- 連関係数(効果量)
-
- φ係数
- クラメールの連関係数
- 残差分析
-
- 調整済み残差
- Z検定
データ間の関連モデルを作る(相関係数と回帰分析)(01/09)
- 到達目標
-
- 散布図と相関係数の関係を理解する。
- 相関行列を用いて知見を得られるようになる。
- (単)回帰分析の概要を理解する。
- 2変数の関係とグラフ表現
-
- 散布図と近似直線
- 正の相関と負の相関
- 因果関係と相関関係
- 関係の強度(効果量)を表す相関係数
-
- 共分散
- 相関係数
- 決定係数
- 相関係数の有意性検定
-
- 自由度
- 標準誤差
- 検定統計量
- t検定
- 単回帰分析
-
- 最小二乗法
- 回帰直線
- 回帰分析の有意性
複数の要因の絡まりを解きほぐす(重回帰分析)(01/16)
- 到達目標
-
- 重回帰分析の概要を理解する。
- ダミー変数の扱い方を理解する。
- 重回帰分析におけるモデル選択の手法を理解する。
- 偏相関係数の読み取り方を理解する。
- 疑似相関を理解する。
- 重回帰分析
-
- 偏回帰係数とその有意性
- 標準化偏回帰係数
- ダミー変数を用いた重回帰分析
- 変数選択
- 疑似相関
-
- 疑似相関
- 偏相関係数
使用ツール・参考サイト
参考文献
- 完全独習 統計学入門 Kindle版小島 寛之 ダイヤモンド社 2006年
- Excelでここまでできる統計解析 今里健一郎・森田浩 日本規格協会 2007年
- 文系のためのSPSS超入門 相川卓也 プレアデス出版 2005年
- Rによるやさしい統計学 Kindle版 山田剛史, 杉澤武俊, 村井潤一郎 オーム社 2013年
- それ、根拠あるの?といわせないデータ・統計分析が出来る本 柏木 吉基 日本実業出版社 2013年