まぬねこの足跡。。。

備忘録+たのしさ+ひっそりと

統計学:回帰分析の決定係数(寄与率=精度)

回帰分析の決定係数(寄与率) 『R²』とは

決定係数【coefficient of determination】:求めた回帰直線の説明力を測定する指標。
 R^2=\dfrac{S_R}{S_T}
 決定係数(当てはまりのよさ=精度)の値=0\sim1の範囲。(0\sim1: 悪い\sim良い)

ちょこっとメモ

回帰直線だけ特別な「決定係数と相関係数の関係」

回帰分析の内で回帰直線のみ『 R^2=r^2』決定係数=相関係数^2が成り立つ

回帰分析の決定係数(寄与率)の考え方

 S_T(総平方和)=S_R(回帰による平方和)+S_e(残差平方和)\\
S_Y^2(yの分散)=\frac{S_T}{n}より、\\
S_Y^2(yの分散)\fallingdotseq S_R(回帰による平方和)+S_e(残差平方和)と割合は同じ。\\
よって、「当てはまりのよさ=精度(説明力)」=「yの散らばり具合」を「回帰直線で説明可能な部分」の割合は、\\
R^2=\dfrac{S_R}{S_T}

ST(総平方和)、SR(回帰による平方和)、Se(残差平方和)の説明

  • 総平方和(yの偏差平方和=yの散らばり具合):S_T=\sum_{i = 1}^n(y_i-\overline{y})^2
  • 回帰による平方和(回帰により説明可能な部分):S_R=\sum_{i = 1}^n(\hat{y}_i-\overline{y})^2
  • 残差平方和(回帰により説明不可な部分):S_e=\sum_{i = 1}^n(y_i-\hat{y})^2s

相関係数【multiple correlation coefficient】『R』

 重回帰による予測値(\hat{y}_i)と実際の観測値(y_i)との相関関係の程度を示す数値。

 R= |\sqrt{R^2}|=\left|\sqrt{\dfrac{S_R}{S_T}}\right|
 重相関係数(当てはまりのよさ=精度)の値=0\sim1の範囲。(0\sim1: 悪い\sim良い)