まぬねこの足跡。。。

備忘録+たのしさ+ひっそりと

統計学:位置の代表値

代表値【measure of central tendency】

位置の代表値:量的変数で、分布の中心的位置を表す(数値)尺度。

  • 平均値
  • 中央値
  • 最頻値

散らばりの代表値:観測値のちらばりの尺度。

位置の代表値

平均値【mean】『\overline{x}

  • 種類:
    • 算術平均(相加平均)
    • 幾何平均(相乗平均)
    • 調和平均
    • トリム平均(刈り込み平均)など

<Good>

  • 比較的意味をとらえやすい。
  • 計算が容易。
  • 山一つ左右対称の分布=平均値は中心的位置。

<Bad>

  • 外れ値の影響を受けやすい。
  • 山一つ左右対称の分布でない\neq平均値は中心的位置。

ちょこっとメモ

平均【average】と【mean】

統計では、別意味となっている。
【average】:分布の中心的位置を表す数値(尺度)。中央値、最頻値、平均
【mean】:平均値

算術平均【arithmetric mean】(相加平均)
  • 各観測値が同じ重要度のとき
     n:観測値の数(サンプルサイズ)※ x_i:各観測値の値

 \displaystyle \overline{x}=\dfrac{1}{n}\sum_{i = 1}^n {x_i}
<式>
 \begin{eqnarray*}
\overline{x} &=& \dfrac{x_1 + x_2 + \cdots + x_n}{n}  \left(=\dfrac{観測値合計}{観測値の個数}\right)\\
&=&\dfrac{1}{n}\sum_{i = 1}^n {x_i} \\
\end{eqnarray*}

幾何平均【geometric mean】(相乗平均)
  • 時間に応じて変化する変化率(比率)の平均値
     n:観測値(変化率)の数(サンプルサイズ)※ x_i:各観測値の値

 \displaystyle\overline{x}_G=\left(\prod_{i=1}^n{x_i}\right)^\frac{1}{n}
<式>
 \begin{eqnarray*}
\overline{x}_G&=&\sqrt[n]{x_1x_2\cdots x_n}  \left(=\sqrt[n]{観測値の総積}\right)\\
&=& \left(\prod_{i=1}^n{x_i}\right)^\frac{1}{n}
\end{eqnarray*}

調和平均【Harmonic mean】
  • 速度・レート(率)の平均値
     n:観測値(率)の数(サンプルサイズ)※ x_i:各観測値の値

 \displaystyle\overline{x}_H=\dfrac{n}{\sum_{i = 1}^n\frac{1}{x_i}}
<式>
 \begin{eqnarray*}
\overline{x}_H&=&\dfrac{n}{\frac{1}{x_1}+\frac{1}{x_2}+\cdots+\frac{1}{x_n}}  \left(=\frac{n}{\frac{1}{率}の総和}\right)\\
&=& \dfrac{n}{\sum_{i = 1}^n\frac{1}{x_i}}
\end{eqnarray*}

トリム平均【Trimmed mean】、刈り込み平均
  • 観測値を昇順(降順)にし、上位と下位から一定の個数(割合)を除外した観測値の平均値
  • 極端な値や外れ値の影響を軽減
     n:観測値(率)の数(サンプルサイズ)※ x_i:各観測値の値

 \overline{x}_k=\dfrac{1}{n-2k}\displaystyle \sum_{i = 1+k}^{n-k}{x_i}

中央値【median(メディアン)】、中位数、メジアン M

 M=Q_2(第2四分位数)

<Good>

  • 外れ値の影響を受けない。

最頻値【mode(モード)

観測値が起こる頻度が最も高い値。度数分布表を作成し、度数の最も多い値。複数もあり得る。

位置の代表値の大小関係

<分布の傾向>
左図:左に裾+一山、中央図:左右対称+一山、右図:右に裾+一山

度数分布表からの平均値

  •  m_i:各階級値 ※ f_i:各度数 ※ N:各度数の合計

 \displaystyle \overline{x}=\sum_{i = 1}^k\left(\dfrac{f_k}{N}\right)x_k

<式>
 \begin{eqnarray*}
\overline{x} &=& \dfrac{m_1f_1 + m_2f_2 + \cdots + m_kf_k}{N}  \left(=\dfrac{(各階級値×各度数)総和}{各度数の合計}\right)\\
&=&\dfrac{1}{N}\sum_{i = 1}^k {m_ix_i} \\
&=&\sum_{i = 1}^k\left(\dfrac{f_k}{N}\right)x_k  \left(=総和\{相対度数×階級値\}\right)\\
\end{eqnarray*}

度数分布表の例
階級
以上未満階級値度数相対度数(%)
(度数÷総階級値)
累積相対度数(%)
250~30027511÷32×100=3.13.1
300~35032500÷32×100=0.03.1
350~40037522÷32×100=6.39.4
400~45042533÷32×100=9.418.8
450~50047522÷32×100=6.325.1
500~55052555÷32×100=15.640.7
550~6005751111÷32×100=34.475.1
600~65062577÷32×100=21.997.0
650~70067511÷23×100=3.1100.0約100.0
合計32約100.0