概率论与数理统计6 统计量与抽样分布

分类:Probability And Mathematical Statistics, 发布于:2019-05-16 09:05:19, 更新于:2019-05-17 20:42:58。 评论

6.1 总体与样本

一、总体与个体

在数理统计中,我们将所研究的对象的全体称为总体,而将总体中的每个成员称为个体

如果一个总体所包含的个体数量是有限的,则称之为有限总体。如果总体所包含的个体数量是无限的,则称之为无限总体。

二、样本

为了对总体$X$进行研究,通常需要从总体中随机地抽取一些个体,这些个体就称为样本。抽得样本的过程称为抽样,样本中个体的数量称为样本容量

设对总体进行了$n$次观测,得到一组数据$(x_1, x_2, \dots, x_n)$,我们称这组数据为样本观察值样本值

为了使样本能够很好地反应总体的特征,我们队随机抽样提出以下要求:

  • 代表性:样本能够代表总体。样本的每个分量$X_i$与总体$X$具有相同的分布。
  • 独立性:$X_1, X_2, \dots, X_n$为相互独立的随机变量。

满足以上两点性质的样本称为简单随机样本,简称为样本。

6.2 统计量与抽样分布

定义 6.1$(X_1, X_2, \dots, X_n)$为总体$X$的一个样本,$T(x_1, x_2, \dots, x_n)$为不含任何未知参数的函数,则称$T(X_1, X_2, \dots, X_n)$为一个统计量

常用的统计量有:

  • 样本均值$$\bar{X} = \dfrac{1}{n} \sum_{i=1}^{n} X_i$$
  • 样本方差(样本二阶中心矩): $$S^2 = \dfrac{1}{n-1} \sum_{i=1}^{n} (X_i - \bar{X})^2$$
  • 样本保准差$$S = \sqrt{\dfrac{1}{n-1} \sum_{i=1}^{n} (X_i - \bar{X})^2}$$
  • 样本$k$阶原点矩$$A_k = \dfrac{1}{n} \sum_{i=1}^{n} X_i^k, \ \ \ k = 1, 2, \dots$$
  • 样本$k$阶中心矩$$B_k = \dfrac{1}{n} \sum_{i=1}^{n} (X_i - \bar{X})^k, \ \ \ k = 1, 2, \dots$$

在一次具体的观察中,统计量是具体的数值;但脱离具体的观察或试验,统计量应看作随机变量。统计量的分布称为抽样分布

6.3 正态总体

一、$\chi^2$分布

定义 6.2$X_1, X_2, \dots, X_n$为独立同分布的随机变量,均服从$N(0, 1)$,则称随机变量 $$\chi_n^2 = \sum_{i=1}^{n} X_i^2$$ 为服从自由度为$n$$\chi^2$分布,记为$\chi_n^2 \sim \chi^2(n)$

$\chi^2$分布具有下令性质:

  • 性质1:若$\chi_1^2 \sim \chi^2(n_1)$$\chi_2^2 \sim \chi^2(n_2)$,则$\chi_1^2$$\chi_2^2$相互独立,且有$\chi_1^2 + \chi_2^2 \sim \chi^2(n_1 + n_2)$
  • 性质2:若$\chi^2 \sim \chi^2(n)$,则$E(\chi^2) = n, D(\chi^2) = 2n$

定理 6.1 柯赫仑分解定理$X_1, X_2, \dots, X_n$为独立同分布的随机变量,均服从$N(0, 1)$。又设 $$Q_1 + Q_2 + \cdots + Q_k = \sum_{i=1}^{n} X_i^2,$$ 其中$Q_i$是秩为$n_i$$X_1, X_2, \dots, X_n$的非负二次型,则$Q_i$相互独立且分别服从自由度为$n_i$$\chi^2$分布的充要条件为 $$n_1 + n_2 + \cdots + n_k = n.$$

二、$t$分布

定义 6.3$X \sim N(0, 1)$$Y \sim \chi^2(n)$,且$X$$Y$相互独立,则称随机变量 $$T = \dfrac{X}{\sqrt{Y/n}}$$ 为服从自由度$n$$t$分布,记为$T \sim t(n)$

$t$分布的密度函数是偶函数。当$n \rightarrow +\infty$时,$p(x)$收敛于标准正态分布$\phi(x)$。故当$n$足够大时,$t$分布近似$N(0, 1)$

三、$F$分布

定义 6.4$U \sim \chi^2(n_1)$$V \sim \chi^2(n_2)$,且$U$$V$相互独立,则称随机变量 $$F = \dfrac{U/n_1}{V/n_2}$$ 为服从自由度为$(n_1, n_2)$$F$分布,记为$F \sim F(n_1, n_2)$

$F$分布具有下列性质:

  • $F \sim F(n_1, n_2)$,则$\dfrac{1}{F} \sim F(n_2, n_1)$
  • $T \sim t(n)$,则$T^2 \sim F(1, n)$

四、上$\alpha$分位点

定义 6.5$X$是一个随机变量,对于给定的数$\alpha (0 < \alpha < 1)$,称满足条件 $$P(X > \lambda_\alpha) = \alpha$$ 的实数$\lambda_\alpha$$X$的上$\alpha$分位点。

对于上$\alpha$分位点$\lambda_\alpha$,当$X \sim N(0, 1)$时记为$u_\alpha$;当$X$服从$\chi^2$$t$$F$分布时分别记为$\chi^2_\alpha(n)$$t_\alpha(n)$$F_\alpha(n_1, n_2)$

$\alpha$分位点具有以下性质:

  • $u_{1 - \alpha} = - u_\alpha$
  • $t_{1 - \alpha}(n) = - t_\alpha(n)$
  • $F_{1 - \alpha}(n_1, n_2) = \dfrac{1}{F_\alpha(n_2, n_1)}$

五、正态总体的样本均值与样本方差的分布

定理 6.2$X_1, X_2, \dots, X_n$是来自正态总体$N(\mu, \sigma^2)$的一个样本,则

  • $\bar{X} \sim N(\mu, \dfrac{\sigma^2}{n})$
  • $\dfrac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1)$
  • $\bar{X}$$S^2$相互独立。

推论 6.1$X_1, X_2, \dots, X_n$是来自正态总体$N(\mu, \sigma^2)$的一个样本,则 $$T = \dfrac{\sqrt{n} (\bar{X} - \mu)}{S} \sim t(n-1).$$

推论 6.2$X_1, X_2, \dots, X_{n_1}$是来自正态总体$N(\mu_1, \sigma_1^2)$的一个样本,$Y_1, Y_2, \dots, Y_{n_2}$是来自正态总体$N(\mu_2, \sigma_2^2)$的一个样本,且两样本相互独立。记$\bar{X}$$\bar{Y}$分别为它们的样本均值,样本(修正)方差分别为 $$S_1^2 = \dfrac{1}{n_1 - 1} \sum_{i=1}^{n_1} (X_i - \bar{X})^2,$$ $$S_2^2 = \dfrac{1}{n_2 - 1} \sum_{i=1}^{n_2} (Y_i - \bar{Y})^2,$$$$F = \dfrac{S_1^2\sigma_2^2}{S_2^2\sigma_1^2} \sim F(n_1 - 1, n_2 - 1).$$

推论 6.3$X_1, X_2, \dots, X_{n_1}$是来自正态总体$N(\mu_1, \sigma^2)$的一个样本,$Y_1, Y_2, \dots, Y_{n_2}$是来自正态总体$N(\mu_2, \sigma^2)$的一个样本,且两样本相互独立,则 $$T = \sqrt{\dfrac{n_1 n_2 (n_1 + n_2 - 2)}{n_1 + n_2}} \dfrac{(\bar{X} - \bar{Y}) - (\mu_1 - \mu_2)}{\sqrt{(n_1 - 1) S_1^2 + (n_2 - 1) S_2^2}} \sim t(n_1 + n_2 - 2).$$

评论