数理統計のうち、区間推定について
- 記述統計と推定・検定の違い
- 記述統計はすべてのデータがそろっている状態でどのようにそれらを分析するか、推定・検定はすべてのデータがそろっていない状態で全体のデータの特徴を分析するということ。
- つまり、前者は母集団を、後者は標本が分析の対象。
注:以下標準化とは
場合分け
- 母平均の推定
−−標本数が多いとき、30以上の時
母平均の推定
- 点推定
まさに平均を一つの値に推定する。標本平均をそのまま母集団の平均と推定すること。
もちろん、実際の母集団の平均がこの値に近い確率は低い、母集団のデータが連続な変化をするならまさに同じである確率は0。
- 標本平均の分布をもとめる,母分散が既知の場合
標本平均の分布の平均はぼ母集団の平均μだけど、分散は違う。
以下N(μ,σ^2)は正規分布のこと。
n個の標本のデータを足したものの分布を考えるとその分布は
になる。つまりこの分布の分散は
なので標準偏差は
nこの標本の平均値の分布を求めるためには、このnこのデータの和の分布の平均と分散をnで割ればいい。すると標本平均の分布の標準偏差は
とわかる。
- 標本平均の分布をもとめる,母分散が未知の場合
既知のときと違って、母集団の分散を標本から推定する。
その推定値は
ここでなぜ、(n-1)が分母なのかを考える。つまり、なぜ標本分散がそのまま母分散の普遍推定値にならないの?ということ。それは、
母分散 = 標本分布のばらつき具合 + 採取する標本のばらつき具合
だかららしい。つまり
△母平均μが決まっているときの標本平均のばらつき具合
△標本平均が決まっているときの標本のばらつき具合
の和が母分散と考えられて、これらの和を実際に計算すると
となる。結局・・・
母平均の推定
- 標準偏差、もしくは母分散がわからない場合(未知の場合)