ソフトウェアを用いたデータ分析法
講義概要/Course outline
学術分野のみならず、ビジネス分野においても統計を用いたデータ分析の需要が高まっている。社会学部出身者は統計を一定理解していることが期待されてしかるべきであり、本学部でも統計分野に関する様々な講義が行われている。しかしその一方で統計をしっかり理解するにはなかなかに困難を伴うことも確かである。
統計分野を理解するには座学だけでなく、実際に手を動かして作業することが早道である。自分でデータを操作し、結果を出力し、その結果を読み取る。そうした作業の積み重ねが統計への理解を深めてくれるだろう。
本実習では統計の基礎知識を定着させるべく、まずはExcelを使用し、集計(統計量の出力)、グラフ作成、グラフの読み取り、そしてその評価(検定)の仕方を説明する。Excelの基本操作の復習も行う。
その後、さらに実践的なデータ分析手法を体得するべく、SPSS・Rという統計用ソフトウェアの操作方法とそれらを用いたデータ分析手法を紹介する。
到達目標/Attainment objectives
ソフトウェアを用いたデータ分析の基本的な技術を習得する。
- Excelの基本操作の復習を行い、実用的に使えるようになる。
- 統計の基本的な概念や分析手法の意味を理解し、扱えるようになる。
- SPSS・Rを用いた基本的なデータ分析を行えるようになる。
- SPSS・Rの出力結果を見て、どのような知見が得られたのか、読み取れるようになる。
※ライティング実習1BでExcelの基本操作は習得することになっているが、現状半期のカリキュラムでは全く不足している。就職後にExcelを「普通に使える」と見なされるレベルのスキルを習得するには本実習を受講して欲しい。
講義方法/Study Method
- 講義形態
- 実習室のPCを用いた実習形式。
- 資料配付
- ウェブサイト上で全ての資料と解説を公開する。
- Excelを用いてデータを整理・集計し、グラフを作成する手順の復習を行う。
- 統計分野の基本概念や分析方法の意味を解説する。
- SPSS・Rを用いた実践的なデータ分析の操作を実践する。
系統的履修/System of study
- 本実習を受講することにより、ライティング実習1Bで学んだExcelの基本操作を定着させることができます。
-
- 統計分野の授業(社会統計学・統計入門など)で学んだ内容を基礎から復習することができます。
- 統計分野の授業を未受講の学生には今後統計分野を学習する際の入り口となります。
担当者からひと言/Advice to students on study and research methods
統計分野の授業を既習の学生も未習の学生も歓迎する。統計の授業を受けたが、よく分からなかった、いまいち理解が足りていないと感じている学生には特に受講して貰いたい。
またライティング実習1BでExcelを学んだが、もう少し深く学びたい、きちんと技術を定着させたいと思っている学生にも受講して欲しい。
実習内容
データ分析概要とソフトウェア(09/26)
- 到達目標
-
- 社会調査全般のなかでの本実習のカバレッジを把握する。
- 統計データを処理できるソフトウェアの特性を理解する。
- 統計で用いられるデータの種類を理解する。
- Excelの基本操作を確認する。
- 本実習の位置付け
-
社会調査士のカリキュラムにおける「B」「C」「D」の内容をコンピュータを用いて実践する。
- 社会調査
-
- 量的調査と質的調査
- 全数調査と標本調査
- 量的データ・質的データ
- 記述統計と推測統計
- 統計データを処理できるソフトウェア
-
- Excel
- SPSS
- R
- 資料・課題
基本的な集計(10/03)
- 到達目標
-
- 各統計量の意味や特性を理解する。
- Excelを用いて集計・グラフ作成を行う。
- 基本統計量
-
- 代表値
- 最大値・最小値
- 範囲
- 散布度
- 分散
- 標準偏差
- 資料・課題
平均値の比較とその検定1(10/10)
- 到達目標
-
- ヒストグラムの意義を理解する。
- 分布と平均値との関係を理解する。
- Excelでヒストグラムを作成する。
- ヒストグラム
-
- 区切り幅
- 度数
- スケール尺度データの最頻値
- 平均値に関する論証
平均値の比較とその検定2(10/17)
- 到達目標
-
- 片側検定と両側検定を正確に理解する
- 平均の差を標準化する意義と方法を理解する
- p値とは何かを理解する
- 推測統計と検定
- 平均値に関する論証
平均値の比較とその検定3(10/24)
- 到達目標
-
- 自由度という概念を理解する
- 分散の推定値を用いたときの基準値との平均値の比較を行う
- 効果量という概念の意義を理解する
- 効果量
- 平均値に関する論証
平均値の比較とその検定4(10/31)
- 到達目標
-
- 対応ある2標本間の平均の比較を適切に行えるようになる。
- 対応ある2標本間の平均の差の検定
平均値の比較とその検定4(11/07)
- 到達目標
-
- 独立した2グループ間での平均の比較を適切に行えるようになる。
- 「ロバスト」という概念を知る。
- 2グループ間の平均の差の検定
- 平均値に関する論証
平均の差の検定総合実習(11/14)
- 到達目標
-
- SPSSの基本操作を理解する。
- Rの基本操作を理解する。
- t検定を実践的に使えるようになる。
3つ以上のグループ間での平均値の比較1(11/21)
- 到達目標
-
- 箱ひげ図を理解する。
- Excelの操作を再確認する。
- 一元配置分散分析の概要を理解する。
- 箱ひげ図
-
- 五数要約(最小値,第1四分位点,中央値,第3四分位点,最大値)
- 平均値と外れ値
- 分散分析概要
- 一元配置の分散分析
-
- Studentのt検定との異同
- 因子による分散と残差による分散
- 分散比Fとその分布(F分布)
- F(片側)検定
- 3グループ以上の平均差の検定
3つ以上のグループ間での平均値の比較2(11/28)
- 到達目標
-
- 一元配置分散分析の概要を理解する。
- 「ロバスト」という概念を再確認する。
- 「検定の繰り返し」の問題を理解する。
- 一元配置の分散分析
-
- 効果量η2
- Welch修正(平均値同等性の耐久検定)
- 多重比較検定
-
- 検定の繰り返し
- Bonferroni調整
- Tukey-Kramer
- Games-Howell
分散分析総合実習(12/05)
- 到達目標
-
- SPSSの操作を再確認する。
- Rの操作を再確認する。
- 一元配置分散分析の意義とソフトウェアによる出力の読み取りを再確認する。
- 分散分析の事例
クロス集計とその検定1(12/12)
- 到達目標
-
- Excel操作の再確認する。
- Excelを用いてクロス集計表を作成できるようになる。
- 比率の比較をする際のグラフ作成のポイントを理解する。
- 「期待値」という概念を再確認する。
- χ2検定の概要を理解する。
- クロス集計表の作成
-
- 度数
- 周辺度数
- グラフ表現
-
- 比率計算
- 帯グラフ
- クロス集計表の独立性の検定
-
- ノンパラメトリック検定
- 実測値・理論値・残差
- Χ2検定
クロス集計とその検定2(12/19)
- 到達目標
-
- クロス集計表独立性の検定におけるχ2検定の限界を知る。
- SPSSのクロス集計表およびその検定結果の出力を読み取れるようになる。
- Rでクロス集計およびその検定を行えるようになる。
- クロス集計の結果を読み取り、レポートにまとめられるようになる。
- χ2検定の限界
- 連関係数(効果量)
-
- φ係数
- クラメールの連関係数
- 残差分析
-
- 調整済み残差
- Z検定
- クロス集計事例
総合課題1(01/09)
- 到達目標
-
- これまで行ってきた分析手法を復習する。
- 分析結果を読み取る。
- 分析結果から簡潔なレポートを作成する。
総合課題2(01/16)
- 到達目標
-
- これまで行ってきた分析手法を復習する。
- 分析結果を読み取る。
- 分析結果から簡潔なレポートを作成する。
使用ツール・参考サイト
参考文献
- Rによるやさしい統計学 Kindle版 山田剛史, 杉澤武俊, 村井潤一郎 オーム社 2013年