統計の話(3)・・・・・平均値と標準偏差について
1.母集団と標本の標準偏差について
全ページの平均値の分布から標準偏差を計算してみます。
δ^2={(30−60)^2+(40−60)^2+(50−60)^2+(50−60)^2+(60−60)^2+(60−60)^2+(70−60)^2
+(70−60)^2+(80−60)^2+(90−60)^2}/
10 = 17.32
となります。先ほど計算した母集団の標準偏差(δ)は28.28でしたが、この分布から計算した標準偏差は母集団の標準偏差(δ)より小さくなってしまっています。
ちょっと個数が多くて計算しずらいですから、簡単に説明します。
平均値も標準偏差もわからない母集団から 2、4 の標本が得られたと仮定します。
標本の平均は (2+8)/2=5
標本の標準偏差は SQR{((2−5)^2+(8−5)^2)/2)}=3
になります。いま平均値を5として計算すると標準偏差は3になりましたが、母集団の平均は5になる保証はどこにもありません。前のページの平均値の分布で、標本から求めた平均値は母集団の不偏推定値であって母集団の平均値になるとは言っていません。
では、平均値が仮に5よりも大きい値で6であったと仮定します。すると標準偏差は
標本の標準偏差(平均値6のとき)は SQR{((2−6)^2+(8−6)^2)/2)}=SQR(10)=3.16
また平均値が5よりも低い値で3だと仮定しますと標準偏差は
標本の標準偏差(平均値3のとき)は SQR{((2−3)^2+(8−3)^2)/2)}=SQR(10)=3.60
このように、標本から計算した標準偏差(s)は、母集団の標準偏差(μ)より低くなると覚えてください。
*重要
この低くなることを除くために、標本の標準偏差(s)から母集団の標準偏差(μ)を推定するためには、
標本の標準偏差(s)=SQR(煤ix−xバー)^2 /( n−1))
の式のようにnで割るのではなく、(n−1)で割ってあげればいいのです。
(付記)
(以下に述べる計算は、標準偏差sを計算するのに分母をnとして計算していますので間違えのないようにしてください)
よいことに、この標準偏差(s)の偏りを補正するには計算式がわかっていますから下の式(1)に代入します。
κ^2=(n / n−1)s^2・・・・・・(1)
(κ^2・・・・母集団(標準脳)の母分散の不偏推定値 n・・・・標本数 s^2・・・標本分散)
式(1)を急に書いてしまってもわからなかもしれませんので簡単に述べます。
標本から得た標本分散は
s^2=煤ixi ー xバー)^2
/ n ・・・・・(2)
で示されますが、先ほどの標本の標準偏差(s)が小さくなりすぎる欠点を補正するために n ではなく (n−1)で割ってあげます。
すると、式(2)は
s^2=煤ixi ー xバー)^2 / n−1 ・・・・・(3)
となります。次に式(3)のs^2 を 母分散(δ^2)の代わりとしての母分散の不偏推定値であるκ^2とします。
すると式(3)は κ^2=煤ixi ー xバー)^2 / n−1 ・・・・・(4)
となりますので、式(4)を変形して
κ^2=n/(n-1)×煤ixi ー xバー)^2
/ n
とすれば、 煤ixi ー xバー)^2 / n = s^2 ですので
κ^2=(n / n−1)s^2
となります。
これで標準偏差(s)の偏りを取り除くことができます。