概率论与数理统计

8 假设检验

2019-06-13 08:43 CST
2019-06-13 20:53 CST
CC BY-NC 4.0

8.1 假设检验的基本概念

一、问题的提出

  • $H_0$:原假设/零假设
  • $H_1$:备择假设/对立假设
  • 单边检验、双边检验
  • 简单假设、符合假设
  • 参数假设检验、非参数假设检验

二、步骤

  • 检验统计量:$U = \dfrac{\bar{X}-\mu_0}{\sigma/\sqrt{n}}$
  • 临界值:$u_{\alpha/2} = \dfrac{k}{\sigma/\sqrt{n}}$
  • 拒绝域:$W = \{ \vert U \vert \geqslant u_{\alpha/2} \}$
  • 接受域:$\{ \vert U \vert < u_{\alpha/2} \}$

假设检验的基本步骤为:

  1. 根据问题提出原假设$H_0$和对立假设$H_1$;
  2. 构造一个合适的统计量,并在$H_0$成立的条件下推导出该统计量的分布;
  3. 给出小概率$\alpha$,确定临界值和拒绝域$W$;
  4. 由样本算出统计量的观察值,若落在拒绝域$W$,则拒绝$H_0$;若落在接受域,则接受$H_0$。

三、两类错误

  1. 第一类错误是原假设$H_0$正确,但由于统计量的值落在拒绝域,而拒绝了原假设$H_0$,也成为弃真错误
  2. 第二类错误是原假设$H_0$不正确,但统计量的值落在接受域,而接受了原假设$H_0$,也成为存伪错误

第一类错误的概率即为$\alpha$,也成为显著性水平

四、$p$值检验法

对于假设检验 $$H_0: \theta \in \Theta_0; \ \ \ H_1: \theta \in \Theta_1.$$ 检验统计量为$T = T(X_1, X_2, \dots, X_n)$,拒绝域$W = \{ \vert T \vert \geqslant \lambda \}$。设$x_1, x_2, \dots, x_n$为样本观察值,检验统计量$T$的观察值为$t = T(x_1, x_2, \dots, x_n)$。则$p$值定义为 $$p(x_1, x_2, \dots, x_n) = \sup_{\theta \in \Theta_0} P_\theta(\vert T \vert \geqslant \vert t \vert).$$

$p$是基于样本观察值而计算出的拒绝原假设的概率,是一个统计量。

8.2 正态总体均值的假设检验

一、单个正态总体$N(\mu, \sigma^2)$均值$\mu$的假设检验

给定显著性水平$\alpha$,$X_1, X_2, \dots, X_n$为来自总体$X \sim N(\mu, \sigma^2)$的一组样本,检验问题为 $$H_0: \mu = \mu_0; \ \ \ H_1: \mu \neq \mu_0.$$

  1. $\sigma^2$已知($u$检验): 在原假设$H_0$成立的情况下,$U \sim N(0, 1)$,于是检验的拒绝域为 $$W = \left\lbrace \vert U \vert = \vert \dfrac{\bar{X}-\mu_0}{\sigma/\sqrt{n}} \vert \geqslant u_{\alpha/2} \right\rbrace.$$ 单边检验: $$H_0: \mu = \mu_0; H_1: \mu > \mu_0 \Rightarrow W = \left\lbrace \dfrac{\bar{X}-\mu_0}{\sigma/\sqrt{n}} \geqslant u_\alpha \right\rbrace.$$ $$H_0: \mu = \mu_0; H_1: \mu < \mu_0 \Rightarrow W = \left\lbrace \dfrac{\bar{X}-\mu_0}{\sigma/\sqrt{n}} \leqslant -u_\alpha \right\rbrace.$$ $$H_0: \mu \leqslant \mu_0; H_1: \mu > \mu_0 \Rightarrow W = \left\lbrace \dfrac{\bar{X}-\mu_0}{\sigma/\sqrt{n}} \geqslant u_\alpha \right\rbrace.$$ $$H_0: \mu \geqslant \mu_0; H_1: \mu < \mu_0 \Rightarrow W = \left\lbrace \dfrac{\bar{X}-\mu_0}{\sigma/\sqrt{n}} \leqslant -u_\alpha \right\rbrace.$$
  2. $\sigma^2$未知($t$检验): 统计检验量为$T = \dfrac{\bar{X} - \mu_0}{S / \sqrt{n}}$。在原假设成立的情况下,$T \sim t(n - 1)$,拒绝域为 $$W = \left\lbrace \vert T \vert = \vert \dfrac{\bar{X} - \mu_0}{S / \sqrt{n}} \vert \geqslant t_{\alpha/2}(n-1) \right\rbrace.$$

二、两个正态总体$N(\mu_1, \sigma_1^2)$,$N(\mu_2, \sigma_2^2)$的均值差的检验

检验问题为 $$H_0: \mu_1 = \mu_2, \ \ \ H_1: \mu_1 \neq \mu_2.$$

  1. $\sigma_1^2, \sigma_2^2$均已知: 检验统计量 $$U = \dfrac{\bar{X} - \bar{Y}}{\sqrt{\dfrac{\sigma_1^2}{n_1} + \dfrac{\sigma_2^2}{n_2}}},$$ 拒绝域 $$W = \left\lbrace \vert U \vert \geqslant u_{\alpha/2} \right\rbrace.$$
  2. 不考 $\sigma_1^2, \sigma_2^2$均未知但相等: 检验统计量 $$T = \sqrt{\dfrac{n_1 n_2 (n_1 + n_2 - 2)}{n_1 + n_2}} \dfrac{\bar{X} - \bar{Y}}{\sqrt{(n_1 - 1) S_1^2 + (n_2 - 1) S_2^2}},$$ 在原假设成立的情况下,$T \sim t(n_1 + n_2 - 2)$,拒绝域为 $$W = \left\lbrace \vert T \vert \geqslant t_{\alpha/2}(n_1 + n_2 - 2) \right\rbrace.$$

三、基于成对数据的假设检验

令$Z_i = X_i - Y_i$,假定$Z_i \sim N(\mu, \sigma^2)$且相互独立,提出假设 $$H_0: \mu = 0; \ \ \ H_1: \mu \neq 0.$$ 由于方差未知,利用$t$检验法,拒绝域为 $$W = \left\lbrace \vert \dfrac{\bar{Z}}{S_Z / \sqrt{n}} \vert \geqslant t_{\alpha/2}(n-1) \right\rbrace.$$ 其中$\bar{Z}$为样本均值,$S_Z$为修正方差。这个检验通常称为成对$t$检验

8.3 正态总体方差的假设检验

一、单个正态总体$N(\mu, \sigma^2)$方差$\sigma^2$的假设检验

检验问题为 $$H_0: \sigma^2 = \sigma_0^2; \ \ \ H_1: \sigma^2 \neq \sigma_0^2,$$ 假定$\mu$未知,取检验统计量 $$\chi^2 = \dfrac{(n-1) S^2}{\sigma_0^2},$$ 在原假设成立的情况下,$\chi^2 \sim \chi^2(n-1)$。拒绝域为 $$W = \left\lbrace \chi^2 \leqslant \chi^2_{1-\alpha/2}(n-1) \right\rbrace \cup \left\lbrace \chi^2 \geqslant \chi^2_{\alpha/2}(n-1) \right\rbrace.$$ 上述检验称为**$\chi^2$检验法**。

二、两个正态总体$N(\mu_1, \sigma_1^2)$,$N(\mu_2, \sigma_2^2)$的方差比的假设检验

检验问题为 $$H_0: \sigma_1^2 = \sigma_2^2; \ \ \ H_1: \sigma_1^2 \neq \sigma_2^2,$$ 检验统计量假定$\mu$未知,取检验统计量 $$F = \dfrac{S_1^2 \sigma_2^2}{S_2^2 \sigma_1^2} \sim F(n_1 - 1, n_2 - 1),$$ 拒绝域 $$W = \left\lbrace F \leqslant F_{1-\alpha/2}(n_1-1, n_2-1) \right\rbrace \cup \left\lbrace F \geqslant F_{\alpha/2}(n_1-1, n_2-1) \right\rbrace.$$ 上述检验称为**$F$检验法**。