資料の整理
度数分布表
%
ある地域に住む住民の身長やある工場で作られる製品の重さなどのように,
いくつかのデータの集まり $x_1$, $x_2$, $x_3$,\ldots, $x_n$ を
\ommindex{資料}{しりょう}という。
資料の個数が多いとき,
資料全体をいくつかの大きさに分類する場合がある。
整理の方法は次のようなものである。
データの最小値と最大値を含む範囲 $[a,b]$ を決め,
それを $n$ 等分したときの分割点を
%
\begin{align*}
a=a_0<a_1<a_2<\cdots <a_n=b
\end{align*}
%
とする。
このとき,
区間 $[a_{k-1},a_{k})$ ($k=1,2,3,\ldots, n$) を
\ommindex{階級}{かいきゅう}といい,
この階級を代表する値である
\ommindex{階級値}{かいきゅうち}を選び,
それを $x_k$ と表す。
階級値 $x_k$ は階級の端点の平均値
%
\begin{align*}
x_k=\frac{1}{\,2\,}(a_{k-1}+a_k)
\end{align*}
%
とする場合が多い。
さらに,
各階級に含まれる資料の個数を $f_k$ とし,
これを,
それぞれの階級に対応する\ommindex{度数}{どすう}という。
度数 $f_k$ は $a_{k-1}$ 以上 $a_{k}$ 未満の資料の個数であるが,
$a_{k}$ 未満の資料の個数を\ommindex{累積度数}{るいせきどすう}といい,
$F_k$ で表す。
すなわち
%
\begin{align*}
F_k=\sum_{i=1}^{k}f_i
\end{align*}
%
である。
これらを用いて次のような表を作る。
%
\begin{align*}
\begin{array}{|c|c|c|c|}
\hline
階級 & 階級値 & 度数 & 累積度数
\\
\hline \hline
a_0\le x <a_1 & x_1 & f_1 & F_1
\\
\hline
a_1\le x <a_2 & x_2 & f_2 & F_2
\\
\hline
a_2\le x <a_3 & x_3 & f_3 & F_3
\\
\hline
\vdots & \vdots & \vdots & \vdots
\\
\hline
a_{n-1}\le x <a_n & x_n & f_n & F_n
\\ \hline
\end{array}
\end{align*}
%
これを\ommindex{度数分布表}{どすうぶんぷひょう}という。
すべての度数の合計を\ommindex{全度数}{ぜんどすう}という。
度数の分布を表したグラフを\ommindex{ヒストグラム}{ひすとぐらむ}という。
下にヒストグラムのサンプル ($n=5$ の場合)を示す。
棒グラフがヒストグラムであり,
折れ線グラフは累積度数のグラフである。
%=image:/media/2015/02/20/142439372448038300.png:
階級に含まれる度数やその階級以下に含まれる累積度数ではなくて,
それらの全度数に対する割合を調べた方が便利な場合がある。
このようなとき,
$\frac{x_i}{\,n\,}$ を\ommindex{相対度数}{そうたいどすう},
$\frac{f_i}{\,n\,}$ を\ommindex{相対累積度数}{そうたいどすう}という。
%
代表値
%
標本の特徴を表す数値を\ommindex{代表値}{だいひょうち}という。
代表値には次のようなものがある。
%
\begin{enumerate}
\item[(1)]
\ommindex{範囲}{はんい}
標本に含まれる値の最大値と最小値の差。
標本の値が広がっている範囲を示す。
\item[(2)]
\ommindex{モード}{モード}
標本を度数分布表によって表したとき,
度数 $f_i$ が最大となる階級またはその階級値。
\item[(3)]
\ommindex{メジアン}{メジアン}
標本に含まれる値を大きさの順に並べたとき,
その中央に位置する値。
\item[(4)]
\ommindex{平均値}{へいきん}
資料 $x_1,x_2,\ldots ,x_n$ に対して,
%
\begin{align*}
\overline{x}
=
\frac{1}{\,n\,}\sum_{k=1}^{n}x_k
=
\frac{1}{\,n\,}(x_1+x_2+\cdots +x_n)
\end{align*}
%
のことをいう。
資料が度数分布表で与えられている場合には,
%
\begin{align*}
\overline{x}
=
\frac{1}{\,n\,}\sum_{k=1}^{n}x_k f_k
=
\frac{1}{\,n\,}(x_1f_1+x_2f_2+\cdots +x_nf_n)
\end{align*}
%
として求めることができる。
資料に含まれている値の中心を求める場合などに用いる。
\item[(5)]
\ommindex{分散}{ぶんさん}
資料 $x_1,x_2,\ldots ,x_n$ の平均値が $\overline{x}$ であるとき,
%
\begin{align*}
v
&=
\frac{1}{\,n\,}\sum_{k=1}^{n}(x_k-\overline{x})^2
\\
&=
\frac{1}{\,n\,}\left\{
(x_1-\overline{x})^2
+(x_2-\overline{x})^2
+\cdots
+(x_n-\overline{x})^2
\right\},
\end{align*}
%
のことをいう。
また,
$v$ の正の平方根を\ommindex{標準偏差}{ひょうじゅんへんさ}といい,
$s$ で表す。
資料が度数分布表で与えられている場合には,
分散は
%
\begin{align*}
v
=
\frac{1}{\,n\,}\sum_{k=1}^{n}(x_k-\overline{x})^2 f_k
\end{align*}
%
として求めることができる。
分散と平均値の間には,
%
\begin{align*}
v=\overline{x^2}-\overline{x}
\end{align*}
%
という関係がある。
ここで,
$\overline{x^2}$ は $x_1^2,x_2^2,\ldots x_n^2$ の平均値で,
%
\begin{align*}
\overline{x^2}=\frac{1}{n}\sum_{k=1}^{n}x_k^2
\quad \mbox{または}\quad
\overline{x^2}=\frac{1}{n}\sum_{k=1}^{n}x_k^2 f_k
\end{align*}
%
である。
分散や標準偏差は,
資料に含まれている値の平均値からの散らばりの大きさを表す数値であり,
これらを\ommindex{散布度}{さんぷど}という。
\end{enumerate}
%
%
相関係数
%
あるクラスの学生の,
数学と国語の得点のように,
2つの数値を組にしたデータ $(x_1,y_1), (x_2,y_2), \ldots, (x_n,y_n)$ が
あるとき,
これらのデータは平面上の点として表すことができる。
%=image:/media/2015/02/20/142439431773175000.png:
この図を\ommindex{相関図}{そうかんず}または
\ommindex{散布図}{さんぷず}という。
このとき,
「数学の得点がよい学生は国語の得点もよい」という傾向がある場合には,
2つのデータの間に\ommindex{正の相関}{せいのそうかん}があるという。
逆に,
「国語の得点がよい学生は数学の得点は悪いようだ」という傾向がある場合には,
\ommindex{負の相関}{負のそうかん}があるという。
さらに,
「数学の得点と国語の得点はあまり関係がない」という場合には,
\ommindex{相関関係}{そうかんかんけい}が認められないなどという。
データ $x_1,x_2,\ldots ,x_n$ を $X$,
$y_1,y_2,\ldots ,y_n$ を $Y$ で表すとき,
次の式を $X$, $Y$ の\ommindex{共分散}{きょうぶんさん}という。
%
\begin{align*}
\Cov[X,Y]
=
\frac{1}{n}\sum_{k=1}^{n}(x_k-\overline{x})(y_k-\overline{y})
=
\overline{xy}-\overline{x}\,\overline{y}
\end{align*}
%
ただし,
%
\begin{align*}
\overline{xy}=\frac{1}{n}\sum_{k=1}^{n}x_k y_k
\end{align*}
%
であり,
$\overline{x}$,
$\overline{y}$ はそれぞれ $X$, $Y$ の平均値である。
また,
$s_x$,
$s_y$ をそれぞれ $X$, $Y$ の標準偏差とするとき,
%
\begin{align*}
r
=
\frac{\Cov[X,Y]}{s_x s_y}
=
\frac{\overline{xy}-\overline{x}\,\overline{y}}%
{\sqrt{\overline{x^2}-\overline{x}^2}
\sqrt{\overline{y^2}-\overline{y}^2}}
\end{align*}
%
を $X$, $Y$ の\ommindex{相関係数}{そうかんけいすう}という。
相関係数 $r$ は
%
\begin{align*}
-1\le r \le 1
\end{align*}
%
を満たし,
$r>0$ ならば正の相関
$r<0$ ならば負の相関があり,
$|r|$ は $1$ に近いほど強い相関関係,
$|r|$ は $0$ に近いほど弱い相関関係にある。
%
回帰直線
%
データの組 $(x_1,y_1), (x_2,y_2),\ldots, (x_n,y_n)$ が,
1つの直線 $\ell$ のまわりに分布していると考え,
$x_k$ の値から $y_k$ の値を予想する。
直線 $\ell$ の方程式を $y=ax+b$ ($a$, $b$ は実数) とおき,
各点 $(x_k,y_k)$ から $y$ 軸に平行な直線に沿う
直線 $\ell$ までの距離を $d_k$ とする。
%=image:/media/2015/02/20/142439439394647400.png:
このとき,
%
\begin{align*}
\sum_{k=1}^{n}d_k^2
=
\sum_{k=1}^{n}\{(ax_k+b)-y_k\}^2
\end{align*}
%
が最小となるように $a$, $b$ を定めると,
$\ell$ の方程式は
%
\begin{align*}
y=\frac{\Cov[X,Y]}{s_x^2}(x-\overline{x})+\overline{y}
\end{align*}
%
となる。
この直線 $\ell$ を,
$Y$ の $X$ への\ommindex{回帰直線}{かいきちょくせん}といいう。
ここで用いたように,
いくつかの値の2乗の和が最小になるように係数を決める方法を,
\ommindex{最小2乗法}{さいしょうじじょうほう}という。
%
標本
母集団
%
ある工場で作られる電球の寿命や,
ある養鶏場で採取される鶏卵の重さなど,
平均や分散を調べようとする対象全体の集合を
\ommindex{母集団}{ぼしゅうだん}という。
母集団に含まれる要素の個数を
\ommindex{母集団の大きさ}{ぼしゅうだんのおおきさ}という。
母集団の大きさが有限のものを
\ommindex{有限母集団}{ゆうげんぼしゅうだん},
無限に多くの要素を含む母集団を
\ommindex{無限母集団}{むげんぼしゅうだん}という。
実際には,
非常の多くの要素を含む場合も無限母集団として扱う。
%
統計で扱う母集団は単なる集合ではなく,
母集団に含まれる要素の,
数値で表されるある性質に着目していることを前提とする。
このとき,
母集団に含まれる要素についての度数分布を
\ommindex{母集団分布}{ぼしゅうだんぶんぷ}といい,
母集団分布の特性を表す数値を\ommindex{母数}{ぼすう}という。
母数には\ommindex{母平均}{ぼへいきん},
\ommindex{母分散}{ぼぶんさん},
\ommindex{母標準偏差}{ぼひょうじゅんへんさ},
\ommindex{母比率}{ぼひりつ}などがある。
母比率とは,
母集団の中に特定の性質をもつもの(製品に含まれる不適合なものなど)が
含まれている割合のことである。
母集団から1つの要素を取り出したときの(寿命や大きさなどの)
値を $X$ とするとき,
$X$ は母集団分布と同じ分布の確率変数と考える。
母集団分布が二項分布にしたがうとき,
その母集団を\ommindex{二項母集団}{にこうぼしゅうだん}といい,
正規分布にしたがうとき\ommindex{正規母集団}{せいきぼしゅうだん}という。
%
標本
%
母数を調べるために, 母集団のすべての要素を調べることを
\ommindex{全数調査}{ぜんすうちょうさ}という。
全数調査は正確であるように思われかもしれないが,
電球の寿命はそれを調べた段階で電球が壊れてしまうので,
全数調査をすることはできない。
全数調査ではなく,
母集団からいくつかの要素を抽出して調べることを
\ommindex{標本調査}{ひょうほんちょうさ}といい,
抽出されたデータを\ommindex{標本}{ひょうほん}という。
標本としてと抽出されたデータの個数を
\ommindex{標本の大きさ}{ひょうほんのおおきさ}という。
標本調査をするためには母集団から偏ることなしに標本を抽出する必要がある。
これを\ommindex{無作為抽出}{むさくいちゅうしゅつ}といい,
無作為抽出された標本を
\ommindex{無作為標本}{むさくいひょうほん}という。
標本を抽出する場合,
要素を取り出すたびにそれを元に戻す方法を
\ommindex{復元抽出}{ふくげんちゅうしゅつ}という。
復元抽出は,
主に母集団の大きさが小さいときに用いられる方法である。
母集団の大きさが大きく,
無限母集団と考えられる場合には,
必要なデータを同時に取り出すことができる。
これを\ommindex{非復元抽出}{ひふくげんちゅうしゅつ}という。
大きさ $n$ の標本は $X_1, X_2, \ldots, X_n$ のように大文字で表す。
無限母集団から無作為抽出された標本,
または有限母集団から復元抽出された標本 $X_1, X_2, \ldots, X_n$ は
互いに独立である。
この項ではそのような場合について記述する。
%
標本分布
%
大きさ $n$ の標本の平均と分散を次のように定める。
%
\begin{enumerate}
\item[(1)]
\ommindex{標本平均}{ひょうほんへいきん}
%
\begin{align*}
\overline{X}
&=
\frac{1}{n}\sum_{k=1}^{n}X_k
\\
&=
\frac{1}{n}(X_1+X_2+\cdots +X_n)
\end{align*}
%
\item[(2)]
\ommindex{標本分散}{ひょうほんぶんさん}
%
\begin{align*}
S^2
&=
\frac{1}{n}\sum_{k=1}^{n}(X_k-\overline{X})^2
\\
&=
\frac{1}{n}\{
(X_1-\overline{X})^2+(X_2-\overline{X})^2
+\cdots +(X_n-\overline{X})^2
\}
\end{align*}
%
また,
標本分散の正の平方根 $S$ を
\ommindex{標本標準偏差}{ひょうほんひょうじゅんへんさ}という。
\item[(3)]
\ommindex{不偏分散}{ふへんぶんさん}
%
\begin{align*}
U^2
=
\frac{n}{n-1}S^2
=
\frac{1}{n-1}\sum_{k=1}^{n}(X_k-\overline{X})^2
\end{align*}
%
\end{enumerate}
%
標本平均,
標本分散,
不偏分散などはいずれも確率変数である。
このように,
標本から得られる確率変数を\ommindex{統計量}{とうけいりょう}といい,
それらがしたがう分布を\ommindex{標本分布}{ひょうほんぶんぷ}という。
母平均が $\mu$,
母分散が $\sigma^2$ である母集団から抽出した,
大きさ $n$ の標本の標本平均 $\overline{X}$ の
平均 $E\left[\,\overline{X}\,\right]$ および
分散 $V\left[\,\overline{X}\,\right]$ について,
%
\begin{align*}
E\left[\,\overline{X}\,\right]
=
\mu,
\quad
V\left[\,\overline{X}\,\right]
=
\frac{\sigma^2}{n}
\end{align*}
%
が成り立つ。
%
推定
推定
%
この項では大きさ $n$ の標本は $X_1, X_2, \ldots, X_n$ は
互いに独立であるものとする。
標本を抽出したときの具体的な値を\ommindex{実現値}{じつげんち}といい,
小文字を用いて $x_1, x_2, \ldots, x_n$ と表す。
実現値から母平均,
母分散,
母比率などの母数の情報を得ることを\ommindex{推定}{すいてい}という。
ある統計量の平均が母数と一致するとき,
この統計量を\ommindex{不偏推定量}{ふへんすいていりょう}といい,
この統計量の実現値を\ommindex{不偏推定値}{ふへんすいていち}という。
母平均と母分散の不偏推定値は次のようになる。
%
\begin{enumerate}
\item[(1)]
母平均の不偏推定値は標本平均の実現値 $\overline{x}$ である。
%
\begin{align*}
\overline{x}=\frac{1}{n}\sum_{n=1}^{n}x_i
\end{align*}
%
\item[(2)]
母分散の不偏推定値は不偏分散の実現値 $u^2$ である。
%
\begin{align*}
u^2=\frac{1}{n-1}\sum_{n=1}^{n}(x_i-\overline{x})^2
\end{align*}
%
\end{enumerate}
%
不偏数定値により母数を推定することを\ommindex{点推定}{てんすいてい}という。
%
区間推定
%
推定したい母数を $\theta$ とする。
$0\le \alpha \le 1$ 満たす
定数 $\alpha$ (多くの場合 $0.05$ または $0.01$) に対して,
$\theta$ が閉区間 $[t_1,t_2]$ に含まれる確率が $1-\alpha$ であるとき,
すなわち
%
\begin{align*}
P(t_1\le \theta\le t_2)=1-\alpha
\end{align*}
%
閉区間 $[t_1,t_2]$ を $100(1-\alpha)$\% の
\ommindex{信頼区間}{しんらいくかん}という。
信頼区間を求めることを\ommindex{区間推定}{くかんすいてい}といい,
$100(1-\alpha)$\% をこの区間推定の
\ommindex{信頼度}{しんらいど}または
\ommindex{信頼係数}{しんらいけいすう}という。
母平均の区間推定
%
\begin{enumerate}
\item[(1)]
正規母集団の母分散 $\sigma^2$ が分かっているとき。
母集団が母平均が $\mu$,
母分散が $\sigma^2$ の正規母集団 $N(\mu,\sigma^2)$ であるとき,
大きさ $n$ の標本の標本平均 $\overline{X}$ は,
正規分布 $N\left(\mu,\frac{\sigma^2}{n}\right)$ にしたがう。
したがって,
母分散 $\sigma^2$ が分かっているとき,
%
\begin{align*}
Z=\frac{\overline{X}-\mu}{\sigma/\sqrt{n}}
\end{align*}
%
は
標準正規分布 $N(0,1)$ にしたがう。
よって,
標本平均の実現値を $\overline{x}$ としたとき,
$100(1-\alpha)\%$ の確率で
%
\begin{align*}
\mu-z\left(\frac{\alpha}{2}\right)\frac{\sigma}{\sqrt{n}}
\le
\overline{x}
\le
\mu+z\left(\frac{\alpha}{2}\right)\frac{\sigma}{\sqrt{n}}
\end{align*}
%
を満たす。
ここで,
$z\left(\frac{\alpha}{2}\right)$ は
標準正規分布 $N(0,1)$ の $\frac{\alpha}{2}$ 点である。
このことから,
母平均 $\mu$ の $100(1-\alpha)\%$ の信頼区間は
%
\begin{align*}
\left[
\overline{x}-z\left(\frac{\alpha}{2}\right)\frac{\sigma}{\sqrt{n}}, \
\overline{x}+z\left(\frac{\alpha}{2}\right)\frac{\sigma}{\sqrt{n}}
\right]
\end{align*}
%
となる。
$95\%$ の信頼区間では $z(0.025)=1.960$,
$99\%$ の信頼区間では $z(0.05)=2.567$ を用いるのが一般的である。
%
\item[(2)]
正規母集団の母分散 $\sigma^2$ が分かっていないとき。
母集団が母平均が $\mu$,
母分散が $\sigma^2$ の正規母集団 $N(\mu,\sigma^2)$ であっても,
母分散 $\sigma^2$ が分かっていないときには (1) の
区間推定を行うことはできない。
$\sigma^2$ を不偏分散の実現値 $u^2$ で代用したとき,
%
\begin{align*}
T=\frac{\overline{X}-\mu}{u/\sqrt{n}}
\end{align*}
%
は,
自由度 $n-1$ の $t$ 分布にしたがう。
よって,
標本平均の実現値を $\overline{x}$ としたとき,
$100(1-\alpha)\%$ の確率で
%
\begin{align*}
\mu-t_{n-1}\left(\alpha\right)\frac{u}{\sqrt{n}}
\le
\overline{x}
\le
\mu+t_{n-1}\left(\alpha\right)\frac{u}{\sqrt{n}}
\end{align*}
%
を満たす。
ここで,
$t_{n-1}\left(\alpha\right)$ は
自由度 $n-1$ の $t$ 分布の $\alpha$ 点である。
このことから,
母平均 $\mu$ の $100(1-\alpha)\%$ の信頼区間は
%
\begin{align*}
\left[
\overline{x}-t_{n-1}\left(\alpha\right)\frac{u}{\sqrt{n}}, \
\overline{x}+t_{n-1}\left(\alpha\right)\frac{u}{\sqrt{n}}
\right]
\end{align*}
%
となる。
\end{enumerate}
%
母比率の区間推定
%
二項母集団から抽出した
大きさ $n$ の標本の標本比率の実現値を $\hat{p}$ とするとき,
母比率 $p$ の $100(1-\alpha)\%$ の信頼区間は
%
\begin{align*}
\left[
\hat{p}-z\left(\frac{\alpha}{2}\right)
\sqrt{\frac{\hat{p}(1-\hat{p})}{n}}
,
\hat{p}+z\left(\frac{\alpha}{2}\right)
\sqrt{\frac{\hat{p}(1-\hat{p})}{n}}
\right]
\end{align*}
%
となる。
%
検定
検定
%
母集団のある母数を $\theta$ とする。
$\theta$ を値 $\theta_0$ と比較したとき,
%
\begin{enumerate}
\item[$\bullet$]
$\theta$ は $\theta_0$ ではない。
\item[$\bullet$]
$\theta$ は $\theta_0$ より大きい。
\item[$\bullet$]
$\theta$ は $\theta_0$ より小さい。
\end{enumerate}
%
のいずれかが正しいかどうかを判断することを,
\ommindex{仮説}{かせつ}の\ommindex{検定}{けんてい}という。
仮説の検定は次の手順で行う。
%
\begin{enumerate}
\item[(1)]
「$
\theta=\theta_0$ である」という仮説を立てる。
これを\ommindex{帰無仮説}{きむかせつ}といい,
$\textrm{H}_0$ と表す。
\item[(2)]
状況に応じて「$\theta\ne \theta_0$ である」,
「$\theta> \theta_0$ である」,
「$\theta< \theta_0$ である」という,
帰無仮説を否定する仮説を立てる。
これを\ommindex{対立仮説}{たいりつかせつ}といい,
$\textrm{H}_1$ と表す。
このとき,
帰無仮説と対立仮説は必ずどちらかの状況が起こるようにする。
たとえば,
対立仮説を「$\textrm{H}_1\,:\,\theta> \theta_0$ である」
とするのは,
周辺の状況から「$\theta<\theta_0$ ということは起こりえない
ことが分かっている場合である。
\item[(3)]
$\theta=\theta_0$ と仮定したとき,
分布が分かっている適切な統計量を選ぶ。
標本を無作為抽出したとき,
その統計量の実現値がとりえない範囲
(その範囲の値をとる確率が非常に小さい範囲)を定める。
この範囲を\ommindex{棄却域}{ききゃくいき}という。
このとき,
``確率が $\alpha$ 以下であれば確率が小さいものとする''
と定めるとき,
$\alpha$ を\ommindex{有意水準}{ゆういすいじゅん}
または\ommindex{危険率}{きけんりつ}という。
\item[(4)]
実際に標本を抽出し,
先に定めておいた統計量の実現値 $a$ を調べる。
(4-1) $a$ が棄却域に含まれる値であった場合には,
$\theta=\theta_0$ という仮定が正しくなかったと判断し,
対立仮説 H$_1$ が正しいと結論できる。
このとき,
帰無仮説を\ommindex{棄却}{ききゃく}するという。
(4-2) $a$ が棄却域に含まない値であった場合には,
帰無仮説を棄却できず,
$\theta=\theta_0$ は正しくないとは判断できない,
という結論となる。
\end{enumerate}
%
仮説の検定をするとき,
次の2種類の誤りが起こりうる。
%
%
\begin{enumerate}
\item[$\bullet$]
H$_0$ が正しいにも関わらず,
H$_0$ を棄却してしまう誤り。
これを\ommindex{第1種の誤り}{だいいっしゅのあやまり}という。
有意水準(または危険率)は第1種の誤りがおこる確率である。
\item[$\bullet$]
H$_0$ が誤っているにも関わらず,
H$_0$ を棄却できない誤り。
これを\ommindex{第2種の誤り}{だいにしゅのあやまり}という。
\end{enumerate}
%
棄却域は,
帰無仮説 H$_0$ に対する対立仮説 H$_1$ がどのようなものかによって,
次のように設定する。
%
\begin{enumerate}
\item[(1)]
対立仮説が H$_1\,:\,\theta\ne \theta_1$ である場合
\\
棄却域を $\theta$ の分布の両側に設ける。
これを\ommindex{両側検定}{りょうがわけんてい}という。
\item[(2)]
対立仮説が H$_1\,:\,\theta> \theta_1$ である場合
\\
棄却域を $\theta$ の分布の右側に設ける。
これを\ommindex{右側検定}{みぎがわけんてい}という。
\item[(3)]
対立仮説が H$_1\,:\,\theta< \theta_1$ である場合
\\
棄却域を $\theta$ の分布の左側に設ける。
これを\ommindex{左側検定}{ひだりがわけんてい}という。
\end{enumerate}
%
右側検定と左側検定を併せて,
\ommindex{片側検定}{かたがわけんてい}という。
いずれの場合も,
帰無仮説 H$_0$ を棄却しやすいように設定される。
%
母比率の検定
%
正規母集団から抽出した大きさ $n$ の標本の標本平均を $\overline{X}$,
不偏分散 を $U$ とする。
このとき,
母平均 $\mu$ に関する帰無仮説「H$_0\,:\,\mu=\mu_0$」についての検定は
次のことを用いて行う。
%
\begin{enumerate}
\item[(1)]
母分散 $\sigma^2$ が分かっているとき。
\\
標本平均 $\overline{X}$ は,
正規分布 $N\left(\mu,\frac{\sigma^2}{n}\right)$ にしたがう。
したがって,
帰無仮説 H$_0\,:\,\mu=\mu_0$ が正しいと仮定すれば,
%
\begin{align*}
Z=\frac{\overline{X}-\mu_0}{\sigma/\sqrt{n}}
\end{align*}
%
は
標準正規分布 $N(0,1)$ にしたがう。
標準正規分布 $N(0,1)$ を用いた検定を
\ommindex{$\boldsymbol{Z}$検定}{ぜっとけんてい}という。
\item[(2)]
母分散 $\sigma^2$ が分かっていないとき。
\\
$\sigma^2$ を不偏分散の実現値 $u^2$ で代用したとき,
帰無仮説 H$_0\,:\,\mu=\mu_0$ が正しいと仮定すれば,
%
\begin{align*}
T=\frac{\overline{X}-\mu_0}{u/\sqrt{n}}
\end{align*}
%
は
自由度 $n-1$ の $t$ 分布にしたがう。
$t$ 分布を用いた検定を
\ommindex{$\boldsymbol{t}$検定}{ぜっとけんてい}という。
\end{enumerate}
%
%
母分散の検定
%
正規母集団から抽出した大きさ $n$ の標本の標本分散を $S^2$ と
する。
このとき,
母分散 $\sigma^2$ に関する
帰無仮説「H$_0\,:\,\sigma^2=\sigma^2_0$」についての検定は
次のことを用いて行う。
%
\begin{enumerate}
\item[$\bullet$]
$\sigma^2=\sigma^2_0$ が正しいと仮定すれば,
%
%
\begin{align*}
\chi^2=\frac{nS^2}{\sigma_0^2}
\end{align*}
%
は自由度 $n-1$ の $\chi^2$ 分布にしたがう。
\end{enumerate}
%
$\chi^2$ 分布 を用いた検定を
\ommindex{$\boldsymbol{\chi}^2$検定}{かいじじょうけんてい}という。
%