まぬねこの足跡。。。

備忘録+たのしさ+ひっそりと

統計学:量的変数 要約(表・グラフ)

量的変数 要約

離散変数

  • 間隔尺度【interval scale】{値に区別+大小+差}:
    観測値をカテゴリ(携帯台数、人)分け・・・度数、棒グラフ

連続変数

  • 比率尺度【continuous scale】{値に区別+大小+差+比率}:
    同じ観測値はほとんど存在しない。⇒観測値を複数のグループ分け・・・度数、グラフ

度数分布表【Degree Distribution Table】

  • 階級:観測値を複数のグループ分け
  • 度数、頻度:階級に含まれる観測値の個数
  • 度数分布:階級ごとに度数を整理した分布 ※度数分布表:度数分布の表。
  • 階級値、階級の代表:主に階級の \frac{上限値+下限値}{2} 又は、各階級内の平均値。
  • 相対度数:各階級の度数全体に対する割合。観測値の個数が異なる複数の集団を比較。
     相対度数=\dfrac{階級の度数}{階級の合計}
  • 累積(相対)度数:相対度数の積み上げた度数。
度数分布表の例
階級
以上未満度数相対度数(%)累積相対度数(%)
250~30013.13.1
300~35000.03.1
350~40026.39.4
400~45039.418.8
450~50026.325.1
500~550515.640.7
550~6001134.475.1
600~650721.997.0
650~70013.1100.0
合計32100.0

グラフ

ヒストグラム

横軸に変数の値で、各階級(ビン)の区間上に長方形(度数と比例する面積)を描く。

度数分布多角形

ヒストグラムの各階級値(長方形の辺の真ん中)を線で結ぶ。

適切な階級値=スタージェスの公式

 適切な階級の数=1+\log_2n(nはデータ数)

ちょこっとメモ

ヒストグラムの階級(ビン)

ちょうどよい階級幅が必要。
階級幅「大」:大きい傾向はわかるが、細かな分布の形状がつかみにくい。
階級幅「小」:各階級の度数が小さい。全体の傾向がつかみにくい。

分布の特徴

  • 右の裾が長い分布

  • 左の裾が長い分布

外れ値

極端に大きい又は小さい観測値