読者です 読者をやめる 読者になる 読者になる

母平均μの信頼区間の求め方:めも

情報・数理

言葉の定義

  • 復元抽出
    • 母集団から標本を得たとして、それを母集団にもどすこと。箱からボールを一個とるとして、それを調べたらまた箱にしまうこと。
  • 復元抽出
    • 母集団から標本を得たとして、それを母集団にもどさないこと。箱からボールを一個とるとして、それを調べたら箱には戻さない。
  • i.i.d.
    • 独立で、同一の分布をもつこと。
  • 無作為標本:random sample
    • 確率変数 x_1 , x_2 , ... , x_n が i.i.d. のとき、この x_1 ... x_n で構成された標本。
  • 統計量:statics
    • 確率変数 x_1 , x_2 , ... , x_n を入力とするあらゆる関数の値を統計量という。つまり標本の値をもとにして計算した数値、例えば標本平均、標本分散は統計量。(関数はボレル可測である必要がある)

信頼区間

ここでは確率変数Xは密度関数f(x;θ)に従うとする。つまり、確率変数Xの分布はθが決まれば一つに定まってその結果として「これから新しく得る標本がa〜bの間に含まれる確率は○×である」といったことがわかるようになる。このようなθを母数というらしい。
 
以下では
T:標本より推定した母数の値
θ_0 :母数の本当の値(で実際は未知)
σ^2 :母集団の分散で既知とする

{ \displaystyle
Z = \frac{\sqrt{n}{T - {\theta}_0}}{\sigma}
}

という変数Zを考えると、Zの分布は平均0、分散1の正規分布N(0,1)に従うことは中心極限定理としてしられている。つまり正規分布表を参考にすれば

 0.95 = -1.96 < Z < 1.96 である確率 = P(-1.96 < Z < 1.96) と書く。


いまこの不等式を θ_0 が不等号で挟まれるように変形するとそれが”区間”となる。

{ \displaystyle
P(-1.96 \lt Z \lt 1.96) \\
= P(-1.96 \lt \frac{\sqrt{n}({T - {\theta}_0})}{\sigma}) \lt 1.96) \\
= P(T - 1.96\frac{\sigma}{\sqrt{n}} \lt {\theta}_0 \lt T + 1.96\frac{\sigma}{\sqrt{n}}) \\
}

という区間がもとめられて、これが95%信頼区間である。

{ \displaystyle
T = \frac{\sqrt{n}(\bar{X} - \mu)}{S}

 S:標本分散
 \bar{X}:標本平均
}

このとき、このTは自由度n-1のt分布に従う。あとは先ほどと同じような変形を行う。

{ \displaystyle
0.95 
= P( -t_{0.025,n-1} \lt T \lt t_{0.025,n-1} ) \\
= P( -t_{0.025,n-1} \lt \frac{\bar{X} - \mu}{\frac{S}{\sqrt{n}}} \lt -t_{0.025,n-1}) \\
= P( \bar{X} - t_{0.025,n-1}\frac{S}{\sqrt{n}} \lt \mu \lt \bar{X} - t_{0.025,n-1}\frac{S}{\sqrt{n}}) \\
}

と式変形できる。



{ \displaystyle

}

参考文献