Rデータ構造と基本的な記法
RのユーザインタフェースはExcelの対極にあるように見える。しかし実際にはExcelと似ている。
Excelではセルにデータを保存するところを変数を使うというのが最大の違いである。
ただ変数には
- 単一データ(スカラー)
- 一列の複数データ(ベクトル,因子)
- 複数列データ(行列、配列)
- 列単位で異なるデータ型のまとまり(データフレーム)
- さまざまな型データをまとめたもの(リスト)
といった様々な型があり、その都度使い分ける必要がある。そこがExcelよりも柔軟でありかつ難しいところである。
Rのデータ構造(概要)
- スカラー(scalar)
-
単一データ
- ベクトル(vector)
-
単一の型の一次元データ集合(A1:A4)
- 因子(factor)
-
一次元カテゴリデータの集合
- 順序付き因子(order)
-
順序付きの一次元カテゴリデータの集合
- 行列(matrix)
-
単一の型の二次元データ集合
- 配列(array)
-
単一の型の多次元データ集合。一般的な言語の「配列」とは意味が異なるので注意。
- データフレーム(data.frame)
-
いわゆるデータベース型のデータ。列単位で同一データ型。
ファイル読み込み時のデータ型。
- リスト(list)
-
複数のデータ型をぶち込める一次元データ集合
Rの基本的な記述
- 基本記法
- 関数
- 外部データ(csvファイル)の読み込み
-
※ここで読み込まれたdataはデータフレーム型である。
関数を作る
関数名 <- function(仮引数){ 具体的な処理の中身 return(戻り値) }