母集団
%
ある工場で作られる電球の寿命や,
ある養鶏場で採取される鶏卵の重さなど,
平均や分散を調べようとする対象全体の集合を
\ommindex{母集団}{ぼしゅうだん}という。
母集団に含まれる要素の個数を
\ommindex{母集団の大きさ}{ぼしゅうだんのおおきさ}という。
母集団の大きさが有限のものを
\ommindex{有限母集団}{ゆうげんぼしゅうだん},
無限に多くの要素を含む母集団を
\ommindex{無限母集団}{むげんぼしゅうだん}という。
実際には,
非常の多くの要素を含む場合も無限母集団として扱う。
%
統計で扱う母集団は単なる集合ではなく,
母集団に含まれる要素の,
数値で表されるある性質に着目していることを前提とする。
このとき,
母集団に含まれる要素についての度数分布を
\ommindex{母集団分布}{ぼしゅうだんぶんぷ}といい,
母集団分布の特性を表す数値を\ommindex{母数}{ぼすう}という。
母数には\ommindex{母平均}{ぼへいきん},
\ommindex{母分散}{ぼぶんさん},
\ommindex{母標準偏差}{ぼひょうじゅんへんさ},
\ommindex{母比率}{ぼひりつ}などがある。
母比率とは,
母集団の中に特定の性質をもつもの(製品に含まれる不適合なものなど)が
含まれている割合のことである。
母集団から1つの要素を取り出したときの(寿命や大きさなどの)
値を $X$ とするとき,
$X$ は母集団分布と同じ分布の確率変数と考える。
母集団分布が二項分布にしたがうとき,
その母集団を\ommindex{二項母集団}{にこうぼしゅうだん}といい,
正規分布にしたがうとき\ommindex{正規母集団}{せいきぼしゅうだん}という。
%
標本
%
母数を調べるために, 母集団のすべての要素を調べることを
\ommindex{全数調査}{ぜんすうちょうさ}という。
全数調査は正確であるように思われかもしれないが,
電球の寿命はそれを調べた段階で電球が壊れてしまうので,
全数調査をすることはできない。
全数調査ではなく,
母集団からいくつかの要素を抽出して調べることを
\ommindex{標本調査}{ひょうほんちょうさ}といい,
抽出されたデータを\ommindex{標本}{ひょうほん}という。
標本としてと抽出されたデータの個数を
\ommindex{標本の大きさ}{ひょうほんのおおきさ}という。
標本調査をするためには母集団から偏ることなしに標本を抽出する必要がある。
これを\ommindex{無作為抽出}{むさくいちゅうしゅつ}といい,
無作為抽出された標本を
\ommindex{無作為標本}{むさくいひょうほん}という。
標本を抽出する場合,
要素を取り出すたびにそれを元に戻す方法を
\ommindex{復元抽出}{ふくげんちゅうしゅつ}という。
復元抽出は,
主に母集団の大きさが小さいときに用いられる方法である。
母集団の大きさが大きく,
無限母集団と考えられる場合には,
必要なデータを同時に取り出すことができる。
これを\ommindex{非復元抽出}{ひふくげんちゅうしゅつ}という。
大きさ $n$ の標本は $X_1, X_2, \ldots, X_n$ のように大文字で表す。
無限母集団から無作為抽出された標本,
または有限母集団から復元抽出された標本 $X_1, X_2, \ldots, X_n$ は
互いに独立である。
この項ではそのような場合について記述する。
%
標本分布
%
大きさ $n$ の標本の平均と分散を次のように定める。
%
\begin{enumerate}
\item[(1)]
\ommindex{標本平均}{ひょうほんへいきん}
%
\begin{align*}
\overline{X}
&=
\frac{1}{n}\sum_{k=1}^{n}X_k
\\
&=
\frac{1}{n}(X_1+X_2+\cdots +X_n)
\end{align*}
%
\item[(2)]
\ommindex{標本分散}{ひょうほんぶんさん}
%
\begin{align*}
S^2
&=
\frac{1}{n}\sum_{k=1}^{n}(X_k-\overline{X})^2
\\
&=
\frac{1}{n}\{
(X_1-\overline{X})^2+(X_2-\overline{X})^2
+\cdots +(X_n-\overline{X})^2
\}
\end{align*}
%
また,
標本分散の正の平方根 $S$ を
\ommindex{標本標準偏差}{ひょうほんひょうじゅんへんさ}という。
\item[(3)]
\ommindex{不偏分散}{ふへんぶんさん}
%
\begin{align*}
U^2
=
\frac{n}{n-1}S^2
=
\frac{1}{n-1}\sum_{k=1}^{n}(X_k-\overline{X})^2
\end{align*}
%
\end{enumerate}
%
標本平均,
標本分散,
不偏分散などはいずれも確率変数である。
このように,
標本から得られる確率変数を\ommindex{統計量}{とうけいりょう}といい,
それらがしたがう分布を\ommindex{標本分布}{ひょうほんぶんぷ}という。
母平均が $\mu$,
母分散が $\sigma^2$ である母集団から抽出した,
大きさ $n$ の標本の標本平均 $\overline{X}$ の
平均 $E\left[\,\overline{X}\,\right]$ および
分散 $V\left[\,\overline{X}\,\right]$ について,
%
\begin{align*}
E\left[\,\overline{X}\,\right]
=
\mu,
\quad
V\left[\,\overline{X}\,\right]
=
\frac{\sigma^2}{n}
\end{align*}
%
が成り立つ。
%