統計的仮説検定をていねいに解説する
1. 推測統計学の概念・用語
仮説検定は、推測統計学の1分野です。そこで、仮説検定の説明に入る前に、まず推測統計学に関する概念や用語のかんたんな定義を述べます。
1.1. 推測統計学とそのモチベーション
推測統計学は、記述統計学を発展させた統計学の体系で、現代的な統計学の基本です。推測統計学の土台には、大数の法則と中心極限定理があり、これらの定理によって分布の収束や近似といった極限的なふるまいの解析学的な扱いが可能になります。
記述統計学のモチベーションは、「観察や調査によって集められた大量のデータそのものを目的に応じて整理・要約する」というものですが、推測統計学では「データの発生元である母集団に確率モデルを想定し、データを標本として捉えることで、データ自身ではなくデータを発生させている根源的な事象に対して推論を行う」という、より貪欲なモチベーションを置いています。
1.2. 概念・用語の定義
手元にあるデータに対して、「母集団と標本」という "枠組み"(frame work)を与えることで、手元のデータと確率モデルを結びつけ、以降の議論を進めやすくします。
母集団と標本
さらに、母集団や標本をそのまま捉えようとするのではなく、母集団の性質を示す「母数」や標本の性質を示す「統計量」を考えることで、理論の厳密さを上げます。 (機械学習の文脈では、統計量のことを特徴量と呼ぶ。)
母数(parameter)
ー 母集団が持っている特性を示す数値
確率変数に依存しない定数 として定義される。*3統計量(statistics)
ー 標本が持っている特性を示す数値
標本についての関数 として定義される。統計量は確率変数。
次に、統計的推測をまとめ、推測統計学における「仮説検定」の位置付けをみてみましょう。統計的推測の手法には、目的に応じて「点推定」「区間推定」「仮説検定」「予測」などがあります。
統計的推測のまとめ:
統計的推測(statistical inference)
ー 標本 に基づいて母集団(の確率分布や、確率モデル)に関する推論を行うこと。
このように、仮説検定とは、母集団の特性(値)を定量的に求めようとする「推定」や「予測」とは異なり、母集団の特性に対する仮説が正しいことを「支持する or 支持しない」の2者択一で判定するための方法論です。しかるに、有意水準 や 値といった指標は、この二者択一の判断に対して妥当性(信頼性)を保証するための数値でしかありません。
どんな検定方式を使おうが、「仮説検定」の枠組みに入る統計手法である限り、データから得られる結果は、仮説を「支持する or 支持しない」のいずれかであることに注意してください。仮説検定では、判断結果(棄却or受容)に対する妥当性(信頼性)を見積もることができますが、データに対する仮説そのものの妥当性(信頼性)を見積もることはできません。
2. 統計的仮説検定
2.1. 母数と標本
仮説検定で重要な概念となる「母数、母数空間」と「標本、標本空間」について、改めておさらいします。
母数空間 と標本空間 :
母数(parameter)
ー 母集団が持っている特性を示す数値.標本(sample)
ー 母集団の部分集合. 母集団から抽出された確率変数(random variable)の組.母数空間(parameter space)
ー 母数 のとり得る値の集合.標本空間(sample space)
ー 標本 のとり得る値の集合.
2.2. 仮説と検定
ここまでで準備が整ったので、いよいよ統計的仮説検定について言及していきます。まずは仮説検定を「仮説」と「検定」に分けて、定義してみます。
仮説検定:
ここで注意すべきは、以下の点です。
- 「仮説」は、母数空間 に対する記述。
- 「検定」は、標本空間 に基づいて行われる。
さて、次に問題となるのは、「母集団に関する何らかの記述が与えられたとき、それをどのように「真 / 偽」と判定するか?」、言い換えると「ある仮説が与えられたとき、それをどのように検定するのか?」です。このような「検定を実施する方法」のことを、検定方式と言います。
ある仮説に対する統計的仮説検定そのものの「性質」は、検定を行う方式(=検定方式)によって決まります。1つの仮説(: 例えば「母集団の平均は1である」)に対して、「支持する or 支持しない」の判断を下す方法として、複数の検定方式が考えられます。
2.3. 有意水準 , P値
母数空間 において、母数 に関する仮説の検定を考える。
- 帰無仮説(null hypothesis) :
- 対立仮説(alternative hypothesis) :
A) 棄却域
帰無仮説 の棄却域 は、標本 に関して定められ、 以下のように定義されます。
ここで、標本 は「母数空間 に基づく確率分布に従う母集団」から抽出されたものだから、その確率は に従うため、「標本 が帰無仮説 の棄却域 に属する確率」は、以下のように定義されます。
標本 が帰無仮説 の棄却域 に属する確率 =
確率 [tex: P{\theta} \left( X \in R \right)] によって、「帰無仮説 を棄却するか否か」を決定します。 このとき「帰無仮説 を棄却する」と判断する際の確率 [tex: P{\theta} \left( X \in R \right)] の最大値を「有意水準 」と呼びます。
有意水準 の検定:
「標本 に基づいて、帰無仮説 : を棄却する」という判断が正しくない確率は、大きくても 以下である。
の棄却域
さらに標本 の棄却域を書き下すと、
となる。
3. 正規母集団についての仮説検定
3.1. 1標本の正規母集団
とする。
また、標本をまとめて とおく。
標本平均:
標本分散:
以下のように、母平均 と母分散 に関する仮説検定を考える。
1標本における, 母平均 と母分散 についての仮説検定
(a) 母平均 の両側検定
(b) 母平均 の片側検定
(c) 母分散 の両側検定
3.1.1. 母平均 の検定(母分散 が既知)
の下で、中心極限定理より、
※ 母平均 の信頼係数 の信頼区間
3.1.2. 母平均 の検定(母分散 が未知)
の下で、
※ 母平均 の信頼係数 の信頼区間
3.1.3. 母分散 の検定
の下で、
※ 母分散 の信頼係数 の信頼区間
3.2 2標本の正規母集団(母分散が等しい)
とする。
とする。
また、標本をまとめて、
,
とおく。
の標本平均:
の標本平均:
以下のように、母平均 と母分散 に関する仮説検定を考える。
2標本における, 母平均 についての仮説検定
(a) 母平均 の同等性についての両側検定
(b) 母平均 の同等性についての片側検定
3.2.1 母平均 の同等性の検定(母分散 が既知)
の下で、中心極限定理(CLT)より、
※ 母平均の差 の信頼係数 の信頼区間
3.2.2 母平均 の同等性の検定(母分散 が未知) "t検定"
標本から(2標本に共通する)母分散を推定した値 を以下のように定義する。
の下で、
※ 母平均の差 の信頼係数 の信頼区間
3.3 2標本の正規母集団(母分散が等しくない)
とする。
とする。
また、標本をまとめて、
,
とおく。
の標本平均:
の標本平均:
の標本分散:
の標本分散:
以下のように、母平均 と母分散 に関する仮説検定を考える。
2標本における, 母平均 と母分散 についての仮説検定
(a) 母平均 の同等性についての両側検定
(b) 母平均 の同等性についての片側検定
(c) 母分散 の同等性についての片側検定
3.3.1 母平均 の同等性の検定(母分散 が既知)
の下で、中心極限定理(CLT)より、
(a) 両側検定の帰無仮説 の棄却域
※ 母平均の差 の信頼係数 の信頼区間
3.3.2 母平均 の同等性の検定(母分散 が未知)
の下で、Welch's test(ウェルチの検定)を用いると、
ただし、 分布の自由度 は以下のように求める。
※ 母平均の差 の信頼係数 の信頼区間
3.3.3 母分散 の同等性の検定 "F検定"
の下で、
※ 母分散の比 の信頼係数 の信頼区間
参考
- 作者: 久保川達也
- 出版社/メーカー: 共立出版
- 発売日: 2017/04/07
- メディア: 単行本
- この商品を含むブログ (1件) を見る
- 作者: 東京大学教養学部統計学教室
- 出版社/メーカー: 東京大学出版会
- 発売日: 1991/07/09
- メディア: 単行本
- 購入: 158人 クリック: 3,604回
- この商品を含むブログ (79件) を見る