言葉の定義
- 復元抽出
- 母集団から標本を得たとして、それを母集団にもどすこと。箱からボールを一個とるとして、それを調べたらまた箱にしまうこと。
- 復元抽出
- 母集団から標本を得たとして、それを母集団にもどさないこと。箱からボールを一個とるとして、それを調べたら箱には戻さない。
- i.i.d.
- 独立で、同一の分布をもつこと。
- 無作為標本:random sample
- 確率変数 x_1 , x_2 , ... , x_n が i.i.d. のとき、この x_1 ... x_n で構成された標本。
- 統計量:statics
- 確率変数 x_1 , x_2 , ... , x_n を入力とするあらゆる関数の値を統計量という。つまり標本の値をもとにして計算した数値、例えば標本平均、標本分散は統計量。(関数はボレル可測である必要がある)
信頼区間
ここでは確率変数Xは密度関数f(x;θ)に従うとする。つまり、確率変数Xの分布はθが決まれば一つに定まってその結果として「これから新しく得る標本がa〜bの間に含まれる確率は○×である」といったことがわかるようになる。このようなθを母数というらしい。
以下では
T:標本より推定した母数の値
θ_0 :母数の本当の値(で実際は未知)
σ^2 :母集団の分散で既知とする
- 母平均μの信頼区間
という変数Zを考えると、Zの分布は平均0、分散1の正規分布N(0,1)に従うことは中心極限定理としてしられている。つまり正規分布表を参考にすれば
0.95 = -1.96 < Z < 1.96 である確率 = P(-1.96 < Z < 1.96) と書く。
いまこの不等式を θ_0 が不等号で挟まれるように変形するとそれが”区間”となる。
という区間がもとめられて、これが95%信頼区間である。
- 正規分布から標本が得られると仮定した下でのμの信頼区間
このとき、このTは自由度n-1のt分布に従う。あとは先ほどと同じような変形を行う。
と式変形できる。