対応のないt−検定とは??(対応のあるt−検定との比較)
1.対応のないt−検定VS対応のあるt−検定
3D−SSPでの統計解析には「対応のないt−検定」と記述してあります。ここでは、この対応のないt−検定の意味を理解すると同時に対応のあるt−検定との違いを記述しようとおもいます。
対応のないt−検定(平均値の差の検定)とは、「独立している2つのものに差があるかどうか」を検定するものであり、例えば「健常人と脳梗塞患者の脳血流量に差があるのか?」「中性脂肪の値は男女で差があるのか?」のように独立している2つの群の違いを検定しているのです。このようなことから独立2群の差の検定などの呼び名も使われています。
これに反し、対応のあるt−検定(平均値の差の検定)とは、「治療前後の治療薬の効果(差)」「教育前後の数学の得点の効果(差)」などを検定するものであります。これは関連ある2群を検定してるのですから関連2群の差の検定などの言葉も使われます。
以上が一般に参考書などに書いてある説明なのですが、統計の勉強をはじめるまえに、同じ差を検定してるのにどこが違うのだろうか?差の検定だったら対応のあり・なしってどんな意味があるんだろうか?そのような疑問をもちました。
私だけなら良いのですが、同じ疑問をいだいてる方がいらっしゃいましたら、これからの説明を読んでください。簡単に書きます。
2.例題で違いを理解する
対応のないt−検定(平均値の差の検定)
健常人3名(A群)と脳梗塞疾患5名(B群)の脳血流量は以下のようである。両群間に差があるか?
A群(x1) B群(x2 50 45 55 45 60 40 30 35 平均(x1)=55 平均(x2)=39
対応のあるt−検定(平均値の差の検定)
健常人にS剤を投与したときの前後の脈拍数を測定したら以下のようであった。S剤には効果があるか?
投与前(x1) 投与後(x2) 差(x1−x2) Aさん 80 70 10 Bさん 60 50 10 Cさん 70 60 10 Dさん 90 84 6 平均x 9
それぞれの検定をおこなう場合の表は上のように書いておこなうのですが、対応のないtー検定ではA群とB群はまったく別の集団で考えてあるのに、対応のあるでは、Aさん、Bさんのように投与前後で同じ人を調べています。
どちらも平均値の差の検定なのですが
対応のないt−検定では差はA群とB群の平均値の差(x1−x2)を検定します。
対応のあるt−検定では、投与前と投与後の平均値の差の検定ではなく、Aさん〜Dさんの投与前後の脈拍数の差をとってきて、その合計を4で割った値(平均)を出してきてなにか計算しています。
このように対応のある検定では、n組(ここでは4組)のデータにつき各ペアーの差を求めて、その平均(ここでは9)を統計量として、この平均値が確率的にどのていど偏った値かを求めていくものなのです。
平均値の差の意味合いが対応のないt−検定ではA群、B群から求めた平均値に差があるかないかを検定することであり、対応のあるt−検定では、ペアーの差の平均値がどうであるかを検定しています。
(注)
補足ですが、対応のないt−検定では各群の分散があるかないかで、同じ平均値の差の検定でも計算方法が異なっていますので、はじめに各群の分散の検定をしてから、分散がない場合の平均値の差の検定をするのか、あるいは、分散のある場合の平均値の差の検定をするのかを決めなければなりません。
検定で大事なことは、検定する計算の数式やその意味合いを理解することは大変ですので、統計ソフトとかエクセルなどを使用して計算すればいのですが、何を検定したいのか、そのためにはどのような検定方法を利用しなければならないのかなどを理解しておく必要があると思います。