データ(統計資料)について
母集団、標本もデータとして扱う。変数【variable】
同じ特徴・性質を持つ値。調査項目。※複数もある。
- 次数:変数の数。
- 観測値:変数の値。
データタイプ
- 尺度【scale】:変数・データを分類するときの基準
変数の値 と 尺度
量的変数【quantitative variable】
- 間隔尺度【interval scale】:(離散変数:飛び飛びの値の変数)
- 比率尺度【continuous scale】、比尺度:(連続変数:小数点以下の値まで含んで値が続く変数。)
質的変数【qualitative variable】(カテゴリカル変数)
- 名義尺度【nominal scale】、名目尺度:値で区別がつくのみ。
- 順序尺度【ordinal scale】:値で大小関係がある値。
表にすると
尺度 | 変数 | 値同士の関係の有無 | ||||||
---|---|---|---|---|---|---|---|---|
区別 | 大小 | 差 | 比率 | 利用可能な統計量 | 例 | |||
質的変数 (カテゴリカル変数) |
名義尺度 | 2値変数 | 〇 | ✖ | ✖ | ✖ | 度数、最頻値 | 性別?(男 or 女) |
多値変数 | 〇 | ✖ | ✖ | ✖ | 曜日、方角 | |||
順序尺度 | 〇 | 〇 | ✖ | ✖ | 上例+中央値、四分位数 | 成績評価 | ||
量的変数 | 間隔尺度 | 離散変数 | 〇 | 〇 | 〇 | ✖ | 上例+平均、標準偏差 | 気温、偏差値 |
比率尺度 | 連続変数 | 〇 | 〇 | 〇 | 〇 | 上例+変動係数、幾何平均 | 身長、体重 |
変数の個数
- 1次元データ:変数1
- 多変量データ、高次元データ:変数が多数。※可視化するとき、3次元までは、可能。
- 多変量解析法:多変量データを解析する為の方法。
時間変動の有無
- 時系列データ:同じ対象で異なる時点での変数の値を与えるデータ。
- クロスセクション・データ:ある時点でのいくつかの異なる対象の調査や測定の結果を与えるデータ。
- パネル・データ:調査対象集団を構成する同一の単位に対して繰り返し調査して、得られるデータ。