目录
第六章 数理统计基础
6.1 总体与样本
6.1.1 总体与个体
定义 6.1(总体与个体) 在数理统计中,将研究对象的全体称为总体,总体中的每个元素称为个体。
总体可以用一个随机变量 $X$ 来表示,$X$ 的分布称为总体分布。
例 6.1 - 研究某批灯泡的寿命:总体是该批灯泡寿命的全体 - 研究某校学生的身高:总体是该校学生身高的全体
6.1.2 样本
定义 6.2(样本) 从总体中抽取的一部分个体称为样本(或子样),样本中所含个体的数目称为样本容量。
简单随机样本: 若样本 $X_1, X_2, \ldots, X_n$ 满足: 1. 每个 $X_i$ 与总体 $X$ 同分布 2. $X_1, X_2, \ldots, X_n$ 相互独立
则称其为简单随机样本,简称样本。
样本的联合分布: - 离散型:$P(X_1 = x_1, \ldots, X_n = x_n) = \prod_{i=1}^n P(X = x_i)$ - 连续型:$f(x_1, \ldots, x_n) = \prod_{i=1}^n f(x_i)$
6.2 统计量
6.2.1 统计量的定义
定义 6.3(统计量) 设 $X_1, X_2, \ldots, X_n$ 是来自总体 $X$ 的样本,$g(X_1, X_2, \ldots, X_n)$ 是样本的函数。若 $g$ 中不含任何未知参数,则称 $g$ 为统计量。
统计量是随机变量,其分布称为抽样分布。
6.2.2 常用统计量
1. 样本均值 $$\bar{X} = \frac{1}{n}\sum_{i=1}^n X_i$$
2. 样本方差 $$S^2 = \frac{1}{n-1}\sum_{i=1}^n (X_i - \bar{X})^2 = \frac{1}{n-1}\left(\sum_{i=1}^n X_i^2 - n\bar{X}^2\right)$$
样本标准差: $S = \sqrt{S^2}$
注: 分母用 $n-1$ 而非 $n$,是为了使 $E(S^2) = \sigma^2$(无偏性)。
3. 样本 $k$ 阶原点矩 $$A_k = \frac{1}{n}\sum_{i=1}^n X_i^k \quad (k = 1, 2, \ldots)$$
4. 样本 $k$ 阶中心矩 $$B_k = \frac{1}{n}\sum_{i=1}^n (X_i - \bar{X})^k \quad (k = 1, 2, \ldots)$$
5. 顺序统计量 将样本按大小排列:$X_{(1)} \leq X_{(2)} \leq \cdots \leq X_{(n)}$,则 $X_{(k)}$ 称为第 $k$ 个顺序统计量。
- 样本中位数:
$$\tilde{X} = \begin{cases} X_{(\frac{n+1}{2})}, & n \text{ 奇}
\frac{1}{2}(X_{(\frac{n}{2})} + X_{(\frac{n}{2}+1)}), & n \text{ 偶} \end{cases}$$
- 样本极差: $R = X_{(n)} - X_{(1)}$
6.3 抽样分布
6.3.1 正态总体的抽样分布
定理 6.1 设 $X_1, X_2, \ldots, X_n$ 是来自总体 $N(\mu, \sigma^2)$ 的样本,则: 1. $\bar{X} \sim N\left(\mu, \frac{\sigma^2}{n}\right)$ 2. $\frac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1)$ 3. $\bar{X}$ 与 $S^2$ 相互独立
6.3.2 三大分布
1. $\chi^2$ 分布(卡方分布)
定义 6.4($\chi^2$ 分布) 设 $X_1, X_2, \ldots, X_n$ 相互独立且都服从 $N(0, 1)$,则称 $$\chi^2 = X_1^2 + X_2^2 + \cdots + X_n^2$$ 服从自由度为 $n$ 的 $\chi^2$ 分布,记为 $\chi^2 \sim \chi^2(n)$。
性质: - $E(\chi^2) = n$,$D(\chi^2) = 2n$ - 可加性: 若 $\chi_1^2 \sim \chi^2(n_1)$,$\chi_2^2 \sim \chi^2(n_2)$,独立,则 $\chi_1^2 + \chi_2^2 \sim \chi^2(n_1 + n_2)$
2. $t$ 分布(学生氏分布)
定义 6.5($t$ 分布) 设 $X \sim N(0, 1)$,$Y \sim \chi^2(n)$,$X$ 与 $Y$ 独立,则称 $$T = \frac{X}{\sqrt{Y/n}}$$ 服从自由度为 $n$ 的 $t$ 分布,记为 $T \sim t(n)$。
性质: - $t$ 分布关于 $y$ 轴对称 - $n \to \infty$ 时,$t(n) \to N(0, 1)$ - $n$ 较大时($n > 30$),可用 $N(0, 1)$ 近似
3. $F$ 分布
定义 6.6($F$ 分布) 设 $U \sim \chi^2(n_1)$,$V \sim \chi^2(n_2)$,$U$ 与 $V$ 独立,则称 $$F = \frac{U/n_1}{V/n_2}$$ 服从自由度为 $(n_1, n_2)$ 的 $F$ 分布,记为 $F \sim F(n_1, n_2)$。
性质: - 若 $F \sim F(n_1, n_2)$,则 $\frac{1}{F} \sim F(n_2, n_1)$ - $F_{1-\alpha}(n_1, n_2) = \frac{1}{F_\alpha(n_2, n_1)}$
6.3.3 正态总体统计量的分布
单正态总体: 设 $X_1, \ldots, X_n \sim N(\mu, \sigma^2)$,则
1. $Z = \frac{\bar{X} - \mu}{\sigma/\sqrt{n}} \sim N(0, 1)$
2. $T = \frac{\bar{X} - \mu}{S/\sqrt{n}} \sim t(n-1)$
3. $\frac{(n-1)S^2}{\sigma^2} = \frac{1}{\sigma^2}\sum_{i=1}^n (X_i - \bar{X})^2 \sim \chi^2(n-1)$
双正态总体: 设 $X_1, \ldots, X_{n_1} \sim N(\mu_1, \sigma_1^2)$,$Y_1, \ldots, Y_{n_2} \sim N(\mu_2, \sigma_2^2)$,独立,则
1. 当 $\sigma_1^2 = \sigma_2^2 = \sigma^2$ 时: $$T = \frac{(\bar{X} - \bar{Y}) - (\mu_1 - \mu_2)}{S_w\sqrt{\frac{1}{n_1} + \frac{1}{n_2}}} \sim t(n_1 + n_2 - 2)$$ 其中 $S_w^2 = \frac{(n_1-1)S_1^2 + (n_2-1)S_2^2}{n_1 + n_2 - 2}$
2. $\frac{S_1^2/\sigma_1^2}{S_2^2/\sigma_2^2} \sim F(n_1-1, n_2-1)$
6.4 分位数
定义 6.7(分位数) 设 $X$ 是随机变量,$\alpha \in (0, 1)$,若 $x_\alpha$ 满足 $$P(X > x_\alpha) = \alpha$$ 则称 $x_\alpha$ 为 $X$ 的上 $\alpha$ 分位数(或上侧 $\alpha$ 分位数)。
等价地:$P(X \leq x_\alpha) = 1 - \alpha$
常用分位数记号: - $u_\alpha$:标准正态分布的上 $\alpha$ 分位数 - $\chi_\alpha^2(n)$:$\chi^2(n)$ 的上 $\alpha$ 分位数 - $t_\alpha(n)$:$t(n)$ 的上 $\alpha$ 分位数 - $F_\alpha(n_1, n_2)$:$F(n_1, n_2)$ 的上 $\alpha$ 分位数
性质: - $u_{1-\alpha} = -u_\alpha$ - $t_{1-\alpha}(n) = -t_\alpha(n)$
6.5 典型例题
例题 6.1 设 $X_1, X_2, X_3, X_4$ 是来自总体 $N(0, 2^2)$ 的样本,令 $$Y = a(X_1 - 2X_2)^2 + b(3X_3 - 4X_4)^2$$ 求 $a, b$ 使 $Y \sim \chi^2(n)$,并确定 $n$。
解: $X_1 - 2X_2 \sim N(0, 4 + 16) = N(0, 20)$,$\frac{X_1 - 2X_2}{\sqrt{20}} \sim N(0, 1)$
$3X_3 - 4X_4 \sim N(0, 36 + 64) = N(0, 100)$,$\frac{3X_3 - 4X_4}{10} \sim N(0, 1)$
取 $a = \frac{1}{20}$,$b = \frac{1}{100}$,则 $Y \sim \chi^2(2)$,$n = 2$。
例题 6.2 设 $X_1, \ldots, X_n$ 是来自总体 $N(\mu, \sigma^2)$ 的样本,求 $E(S^2)$ 和 $D(S^2)$。
解: $\frac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1)$
$E\left(\frac{(n-1)S^2}{\sigma^2}\right) = n-1$,故 $E(S^2) = \sigma^2$
$D\left(\frac{(n-1)S^2}{\sigma^2}\right) = 2(n-1)$,故 $D(S^2) = \frac{2\sigma^4}{n-1}$
6.6 习题
基础题 1. 设 $X_1, \ldots, X_{10}$ 是来自总体 $N(0, 0.3^2)$ 的样本,求 $P(\sum_{i=1}^{10} X_i^2 > 1.44)$。
2. 设 $X_1, X_2, X_3, X_4$ 是来自总体 $N(0, 1)$ 的样本,$Y = \frac{(X_1 + X_2)^2}{(X_3 - X_4)^2}$,求 $Y$ 的分布。
提高题 3. 设 $T \sim t(n)$,证明:$T^2 \sim F(1, n)$。
4. 设 $X_1, \ldots, X_n$ 是来自总体 $N(\mu, \sigma^2)$ 的样本,$\bar{X}$ 和 $S^2$ 分别是样本均值和样本方差。又设 $X_{n+1} \sim N(\mu, \sigma^2)$ 且与 $X_1, \ldots, X_n$ 独立,求统计量 $Y = \frac{X_{n+1} - \bar{X}}{S}\sqrt{\frac{n}{n+1}}$ 的分布。
挑战题 5. 设 $X_1, \ldots, X_n$ 是来自总体 $N(\mu, \sigma^2)$ 的样本,$\bar{X}_k = \frac{1}{k}\sum_{i=1}^k X_i$($1 \leq k < n$),求统计量 $T = \frac{\bar{X}_n - \bar{X}_k}{S_k}\sqrt{\frac{k(n-k)}{n}}$ 的分布,其中 $S_k^2 = \frac{1}{k-1}\sum_{i=1}^k (X_i - \bar{X}_k)^2$。
6. 设 $X_{(1)} \leq X_{(2)} \leq \cdots \leq X_{(n)}$ 是来自总体 $N(0, 1)$ 样本的顺序统计量,求 $E(X_{(n)})$ 和 $D(X_{(n)})$ 的近似表达式($n$ 较大时)。
<html> <script type=“text/javascript” async
src="https://cdn.jsdelivr.net/npm/mathjax@3/es5/tex-mml-chtml.js">
</script> </html>
