統計の話(6)・・・・・t-検定をするまえの準備@
1.t-検定をはじめるにあたって
3D−SSPに検定の箇所があります。ここでは対応のないt−検定と記述されています。しかし、t−検定には対応のあるt−検定もあります。この意味の違いや、なぜt−検定(t−分布表を使用した)なのか、正規分布はなぜ使えないのかなどついての基礎的な説明と、今まで述べてきた標準偏差や分散などの用語の意味を簡単に説明します。
これらのことが明確につかめていないと(私もはっきりとは理解できていないのですが・・・)t−検定をおこなう上で混乱をおこします(私もその一人です)のでこの頁はよく理解してください。
2.平均値や分散、標準偏差の正確な用語と意味を理解する
分散と標準偏差の頁で、なんとは無しに分散とか標準偏差との言葉を使ってきました。この言葉では説明不足であると思い、補足として用語についての 説明をさせていただきます。
私たちはなにも気にしないで平均値、分散、標準偏差を計算していますが、それは母集団の母平均や母標準偏差を推定するために利用するのか、
また、ただ単に標本の平均値や標準偏差を求めているかによって計算方法も異なってきますのではじめに用語の意味を十分理解してください。
(ただし教科書や文献により呼び名が適当でないものもありますので注意してください)
サンプル数 データの個数(n) 分散 データの平均値との差の平方(2乗)をデータ数nで割った値 標準偏差 分散の平方根(√) (nで割った値) 不偏分散(母分散の不偏推定値) データの平均値との差の平方(2乗)をデータ数nー1で割った値 標本標準偏差 不偏分散の平方根(√) (nー1で割った値)
このような定義があるようですが、標本標準偏差との言葉はおめにかからないと言ってる本もあります。これらの定義を覚えることも大事なのでしょうが、定義を調べてもすべての参考書が同じようなとりあつかいをしていないのが問題です。ここでは定義を上のようにして話をはじめます。
3.平均値の差の検定・・・・・対応なしの検定
対応のない検定とは、例えば2つの集団でA薬を投与したときとB薬を使用したときの血圧の平均値が有意な差があるかどうかなどを調べる時に使用します。前提としてこれらの母集団は正規分布していることが約束されていなければなりません。
いま平均値に差があるかどうかを検定するわけですから、2つの母集団のばらつきが違っていると困ります。そこで対応なしのt検定をする場合には分散に差があるかないかで検定の方法が異なってきます。
そのために最初におこなわれるのが
@2つの母集団の分散に有意な差があるかどうかを検定しなければなりません。
上の検定で差がないとなったらば
A分散に有意差なしの平均値の差の検定
分散に差があったならば
B分散に有意差ありの平均値の差の検定
このような段階を経てt−検定がなされていきます。
3.平均値の差の検定・・・・・対応ありの検定
対応のある検定とは、治療前後の白血球数の平均値や投薬前後の血圧の平均値を検定するもので、一人の患者さんについての検定となりますから、対応なしに比較して分散の有意差を検定する必要はありませんので計算は楽となります。
4.t−分布、F−分布などについて
検定に入る前に、t−検定ではt−分布表、分散を検定するにはFー分布表を利用しなければなりません。ここでt−表を利用して云々と言ってもt−分布 表とはF−分布表とはなにであるかなどの事柄が理解できていないと困りますし、検定とは具体的になにをしてるのかもわかっていないと前には進めない と思いますので、次頁からはこれらの事柄に触れながら、検定の大筋をつかんでいきたいとおもいます。次頁からの内容は、検定をする際の重要な事項 ですので十分理解してください。なお、検定の結果さえ導き出されれば問題なしとされる方はとばしてください。