概率论与数理统计2 随机变量及其概率分布

分类:Probability And Mathematical Statistics, 发布于:2019-04-24 14:06:53, 更新于:2019-04-26 19:47:45。 评论

随机变量定义、性质略。

2.2 离散型随机变量及其分布

1. 0-1分布

随机变量的可能取值只有0和1,且 $$P(X = 1) = p, \ \ \ P(X = 0) = 1 - p.$$

2. 二项分布

若随机变量$X$的分布律为 $$p_k = P(X = k) = C_n^k p^k q^{n-k},$$ 其中$q = 1-p$,则称$X$服从参数为$n, p$的二项分布,记为$X \sim B(n, p)$

  • $(n + 1)p$为整数时,$p_k$$k = (n + 1)p - 1$$k = (n + 1)p$达到最大。
  • $(n + 1)p$不是整数时,$p_k$$k = \lfloor (n + 1)p \rfloor$达到最大。

3. 泊松分布

若随机变量$X$的分布律为 $$p_k = P(X = k) = \dfrac{\lambda^k}{k!} e^{-\lambda},$$ 其中$\lambda > 0$为常数,则称$X$服从参数为$\lambda$的泊松分布,记为$X \sim P(\lambda)$

4. 几何分布

若随机变量$X$的分布律为 $$p_k = P(X = k) = q^{k-1}p,$$ 其中$0 < p < 1$为常数,$q = 1 - p$,则称$X$服从参数为$p$的几何分布,记为$X \sim g(p)$

几何分布的无记忆性 若前$t$次试验没有出现$A$,则再试验$s$次。$A$首次出现的概率与前面没有出现的$t$次试验无关。即 $$P(X = s + t \vert X > t) = P(X = s).$$

2.3 连续型随机变量及其分布

1. 均匀分布

若随机变量$X$的概率密度函数为 $$p(x) = \begin{cases} \dfrac{1}{b-a}, &a<x<b, \\ 0, &\text{o.w.}, \end{cases}$$ 则称$X$在区间$[a, b]$上服从均匀分布,记为$X \sim U[a, b]$

2. 指数分布

若随机变量$X$的概率密度函数为 $$p(x) = \begin{cases} \lambda e^{-\lambda x}, &x \geqslant 0, \\ 0, &x < 0, \end{cases}$$ 其中$\lambda > 0$为常数,则称$X$服从参数为$\lambda$的指数分布,记为$X \sim E(\lambda)$

3. 正态分布

若随机变量$X$的密度函数为 $$p(x) = \dfrac{1}{\sqrt{2\pi}\sigma} \exp \left\lbrace -\dfrac{(x - \mu)^2}{2\sigma^2} \right\rbrace,$$ 其中$\mu, \sigma (> 0)$为常数,则称$X$服从参数为$\mu$$\sigma^2$的正态分布,记为$X \sim N(\mu, \sigma^2)$

正态分布的密度函数具有以下特征:

  • 关于$x = \mu$对称,切对任意$b > 0$$P(X \leqslant \mu - b) = P(X \geqslant \mu + b)$
  • $x \rightarrow \pm \infty$$p(x) \rightarrow 0$,曲线以$x$轴为渐近线。
  • $x = \mu$$p(x)$取得最大值$\dfrac{1}{\sqrt{2\pi}\sigma}$。固定$\mu$时,$\sigma$越小,最大值越大,图形越高越陡峭;$\sigma$越大,最大值越小,图形越低越平缓。
  • 固定$\sigma$$\mu$变化时,曲线沿对称轴$x = \mu$平移。

$\mu = 0$$\sigma = 1$时,$X \sim N(0, 1)$,称$X$服从标准正态分布,其密度函数和分布函数分别记为$\phi(x)$$\Phi(x)$$$\phi(x) = \dfrac{1}{\sqrt{2\pi}} \exp\left\lbrace -\dfrac{x^2}{2} \right\rbrace, $$ $$\Phi(x) = \int_{-\infty}^x \dfrac{1}{\sqrt{2\pi}} \exp\left\lbrace -\dfrac{t^2}{2} \right\rbrace \text{d}t,$$ 对标准正态分布的分布函数$\Phi(x)$$\Phi(-x) = 1 - \Phi(x)$

定理 2.1 若随机变量$X \sim N(\mu, \sigma)$,则$Z = \dfrac{X - \mu}{\sigma} \sim N(0, 1)$

2.4 随机变量函数的分布

离散型变量直接枚举即可。

对连续型随机变量,常用的方法是分布函数法,先求$Y$的分布函数$F_Y(y)$,即 $$F_Y(y) = P(Y \leqslant y) = P(g(X) \leqslant y) = \int_{g(x) \leqslant y} p_X(x) \text{d}x,$$ 然后$p_Y(y) = F_Y'(y)$

定理 2.2 设随机变量$X$的可能取值范围为$(a, b)$$X$的概率密度为$p_X(x)$$a < x < b$。设函数$y = g(x)$处处可导,且恒有$g'(x) > 0$(或恒有$g'(x) < 0$),则$Y = g(X)$为连续型随机变量,其概率密度为 $$p_Y(y) = \begin{cases} p_X\left( g^{-1}(y) \right) \cdot \left\vert \left( g^{-1}(y) \right)' \right\vert, & \alpha < y < \beta, \\ 0, & \text{o.w.}. \end{cases}$$ 其中$\alpha = \min\{g(a), g(b)\}$$\beta = \max\{g(a), g(b)\}$$g^{-1}(y)$$y = g(x)$的反函数。

评论