要約
集計⇒多数個の変数⇒小数個の数値やグラフ・表グラフ
- 折れ線グラフ
- 時系列データの変化の様子
- 時系列データの指数、指標
基準時点:ある時点 - 時系列データの変化の様子
ちょこっとメモ
注意:時系列データの折れ線
時間間隔を均等に。謝ったイメージを持たせるグラフになってしまう。対数 利用
比率を使た方法=対数変換(対数で表示)
例)成長率
度数、頻度:カテゴリに属する観測値の個数。
所属グループ | 度数 | 割合(%) |
---|---|---|
A | 845 | 56 |
B | 153 | 10 |
C | 98 | 7 |
D | 89 | 6 |
E | 45 | 3 |
F | 12 | 1 |
無回答 | 258 | 17 |
合計 | 1500 | 100 |
犬 | 猫 | 合計 | |
---|---|---|---|
男 | 87 | 65 | 152 |
女 | 73 | 95 | 168 |
合計 | 160 | 160 | 320 |
犬 | 猫 | 合計 | ||||
---|---|---|---|---|---|---|
男 | 87 | 57.2% | 65 | 42.8% | 152 | 100.0% |
女 | 73 | 43.5% | 95 | 56.5% | 168 | 100.0% |
犬 | 猫 | |||
---|---|---|---|---|
男 | 87 | 54.4% | 65 | 40.6% |
女 | 73 | 45.6% | 95 | 59.4% |
合計 | 160 | 100.0% | 160 | 100.0% |
犬 | 猫 | 合計 | ||||
---|---|---|---|---|---|---|
男 | 87 | 27.2% | 65 | 20.3% | 152 | 47.5% |
女 | 73 | 22.8% | 95 | 29.7% | 168 | 52.5% |
合計 | 160 | 50.0% | 160 | 50.0% | 320 | 100.0% |
各カテゴリの合計とその度数・・・割合を見るには計算が必要
グラフをみるとき、目盛りに注意。{開始位置や目盛りの幅など}
⇒表現の仕方によって、同じグラフでも違って見えてしまう。
同じ特徴・性質を持つ値。調査項目。※複数もある。
尺度 | 変数 | 値同士の関係の有無 | ||||||
---|---|---|---|---|---|---|---|---|
区別 | 大小 | 差 | 比率 | 利用可能な統計量 | 例 | |||
質的変数 (カテゴリカル変数) |
名義尺度 | 2値変数 | 〇 | ✖ | ✖ | ✖ | 度数、最頻値 | 性別?(男 or 女) |
多値変数 | 〇 | ✖ | ✖ | ✖ | 曜日、方角 | |||
順序尺度 | 〇 | 〇 | ✖ | ✖ | 上例+中央値、四分位数 | 成績評価 | ||
量的変数 | 間隔尺度 | 離散変数 | 〇 | 〇 | 〇 | ✖ | 上例+平均、標準偏差 | 気温、偏差値 |
比率尺度 | 連続変数 | 〇 | 〇 | 〇 | 〇 | 上例+変動係数、幾何平均 | 身長、体重 |
確率モデルからデータが生成されたと仮定して、データから確率モデルの性質を推測する。
※あくまで憶測の範囲での推測。100%はない。不確実性の中で評価する。
興味や研究などの調査対象の集まりすべて。標本を抽出するためのデータ発生元となる統計量の集まりすべて。
母集団から抽出したデータの集まり。