まぬねこの足跡。。。

備忘録+たのしさ+ひっそりと

pandasとnumpy 分散「var()」の違い

pandas

ddof=0:標本標準偏差  <デフォルト>
ddof=1:母標準偏差

<デフォルト>標本標準偏差 ddof=0

q=pd.Series([-4,-2,0,2,4])
print(f'平均={q1.mean()} 分散={q1.var(ddof=0)}  標準偏差= {q1.std()}')

平均=0.0 分散=8.0  標準偏差= 3.1622776601683795

標準偏差 ddof=1

q=pd.Series([-4,-2,0,2,4])
print(f'平均={q1.mean()} 分散={q1.var(ddof=1)}  標準偏差= {q1.std()}')

平均=0.0 分散=10.0  標準偏差= 3.1622776601683795

numpy

ddof=0:標本標準偏差
ddof=1:母標準偏差  <デフォルト>

標本標準偏差 ddof=0

q1=np.array([-4,-2,0,2,4])
print(f'平均={q1.mean()} 分散={q1.var(ddof=0)}  標準偏差= {q1.std()}')

平均=0.0 分散=8.0  標準偏差= 3.1622776601683795

<デフォルト>母標準偏差 ddof=1

q1=np.array([-4,-2,0,2,4])
print(f'平均={q1.mean()} 分散={q1.var()}  標準偏差= {q1.std()}')

平均=0.0 分散=10.0  標準偏差= 3.1622776601683795