統計の話（３）平均値と標準偏差について

統計の話（３）・・・・・平均値と標準偏差について

１．母集団と標本の標準偏差について

　全ページの平均値の分布から標準偏差を計算してみます。

　　　δ＾２＝｛（３０－６０）＾２＋（４０－６０）＾２＋（５０－６０）＾２＋（５０－６０）＾２＋（６０－６０）＾２＋（６０－６０）＾２＋（７０－６０）＾２
　　
　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　＋（７０－６０）＾２＋（８０－６０）＾２＋（９０－６０）＾２｝/ １０　＝　１７．３２

　となります。先ほど計算した母集団の標準偏差（δ）は２８．２８でしたが、この分布から計算した標準偏差は母集団の標準偏差（δ）より小さくなってしまっています。

　ちょっと個数が多くて計算しずらいですから、簡単に説明します。

平均値も標準偏差もわからない母集団から　２、４　の標本が得られたと仮定します。

　　　　　　　　　　　　標本の平均は　　　　　　　　　　　（２＋８）/２＝５
　　　　　　　　　　　　標本の標準偏差は　　　　　　　　ＳＱＲ｛（（２－５）＾２＋（８－５）＾２）/２）｝＝３

になります。いま平均値を５として計算すると標準偏差は３になりましたが、母集団の平均は５になる保証はどこにもありません。前のページの平均値の分布で、標本から求めた平均値は母集団の不偏推定値であって母集団の平均値になるとは言っていません。

では、平均値が仮に５よりも大きい値で６であったと仮定します。すると標準偏差は

　　　　　　　標本の標準偏差（平均値６のとき）は　　　　　　　　ＳＱＲ｛（（２－６）＾２＋（８－６）＾２）/２）｝＝ＳＱＲ（１０）＝３．１６

また平均値が５よりも低い値で３だと仮定しますと標準偏差は

　　　　　　　標本の標準偏差（平均値３のとき）は　　　　　　　　ＳＱＲ｛（（２－３）＾２＋（８－３）＾２）/２）｝＝ＳＱＲ（１０）＝３．６０

このように、標本から計算した標準偏差（ｓ）は、母集団の標準偏差（μ）より低くなると覚えてください。

＊重要
　　　　　この低くなることを除くために、標本の標準偏差（ｓ）から母集団の標準偏差（μ）を推定するためには、

　　　　　　　　　　　　　　　　　標本の標準偏差（ｓ）＝ＳＱＲ（∑（ｘ－ｘバー）＾２ /（ｎ－１））

　　　　　　　　　　　　　　の式のようにｎで割るのではなく、（ｎ－１）で割ってあげればいいのです。

（付記）

（以下に述べる計算は、標準偏差ｓを計算するのに分母をｎとして計算していますので間違えのないようにしてください）

　よいことに、この標準偏差（ｓ）の偏りを補正するには計算式がわかっていますから下の式（１）に代入します。
　　
　　　　　　　　　　　　　　　　　　　　　　　　　κ＾２＝（ｎ / ｎ－１）ｓ＾２・・・・・・（１）

　　　　　　　　　　（κ＾２・・・・母集団（標準脳）の母分散の不偏推定値　　　ｎ・・・・標本数　　　ｓ＾２・・・標本分散）
　
式（１）を急に書いてしまってもわからなかもしれませんので簡単に述べます。

　標本から得た標本分散は

　　　　　　　　　　　　　　　　　　　　　　　　　ｓ＾２＝∑（ｘi　ー　ｘバー）＾２ / n　・・・・・（２）　

で示されますが、先ほどの標本の標準偏差（ｓ）が小さくなりすぎる欠点を補正するために　ｎ　ではなく　（ｎ－１）で割ってあげます。
すると、式（２）は　　　　　　　　　　　　　　　　

　　　　　　　　　　　　　　　　　　　　　ｓ＾２＝∑（ｘi　ー　ｘバー）＾２ / n－１　・・・・・（３）　

となります。次に式（３）のｓ＾２　を　母分散（δ＾２）の代わりとしての母分散の不偏推定値であるκ＾２とします。

すると式（３）は　　　　　　　　　　　　　　　κ＾２＝∑（ｘi　ー　ｘバー）＾２ / n－１　・・・・・（４）　　　　

となりますので、式（４）を変形して

　　　　　　　　　　　　　　　　　　　　　　　　κ＾２＝ｎ/(n-1)×∑（ｘi　ー　ｘバー）＾２ / ｎ

とすれば、　∑（ｘi　ー　ｘバー）＾２ / ｎ　＝　ｓ＾２　ですので　　　　　　　　　　　　　　　　

　　　　　　　　　　　　　　　　　　　　　　　　κ＾２＝（ｎ / ｎ－１）ｓ＾２

となります。

　　　　　　　　　　　　　　　　　　　　　　　　

これで標準偏差（ｓ）の偏りを取り除くことができます。