设 $X_1, X_2, \\ldots, X_n$ 来自 $N(\\mu, \\sigma^2)$,其中 $\\sigma^2$ 已知,检验关于 $\\mu$ 的假设。
检验问题:$H_0: \\mu = \\mu_0$ vs $H_1: \\mu \\neq \\mu_0$
检验统计量: $$Z = \\frac{\\bar{X} - \\mu_0}{\\sigma/\\sqrt{n}} \\sim N(0, 1) \\quad (H_0 \\text{ 成立时})$$
拒绝域(显著性水平 $\\alpha$): $$|Z| \\geq u_{\\alpha/2}$$
或等价地: $$\\bar{X} \\leq \\mu_0 - \\frac{\\sigma}{\\sqrt{n}}u_{\\alpha/2} \\quad \\text{或} \\quad \\bar{X} \\geq \\mu_0 + \\frac{\\sigma}{\\sqrt{n}}u_{\\alpha/2}$$
例 7.1:某工厂生产的零件长度服从 $N(\\mu, 0.5^2)$。标准长度为10cm。现抽取16个零件,测得平均长度为10.3cm。问:零件长度是否偏离标准?($\\alpha = 0.05$)
解:
$H_0: \\mu = 10$ vs $H_1: \\mu \\neq 10$
$Z = \\dfrac{10.3 - 10}{0.5/\\sqrt{16}} = \\dfrac{0.3}{0.125} = 2.4$
$u_{0.025} = 1.96$
因为 $|Z| = 2.4 > 1.96$,拒绝 $H_0$。
结论:零件平均长度与标准有显著差异。
当 $\\sigma^2$ 未知时,用样本方差 $S^2$ 代替。
检验统计量: $$T = \\frac{\\bar{X} - \\mu_0}{S/\\sqrt{n}} \\sim t(n-1) \\quad (H_0 \\text{ 成立时})$$
拒绝域: $$|T| \\geq t_{\\alpha/2}(n-1)$$
例 7.2:某灯泡厂声称其灯泡平均寿命不低于1000小时。随机抽取20个灯泡测试,测得平均寿命980小时,样本标准差80小时。检验该厂说法是否可信。($\\alpha = 0.05$)
解:
$H_0: \\mu \\geq 1000$ vs $H_1: \\mu < 1000$(左边检验)
$T = \\dfrac{980 - 1000}{80/\\sqrt{20}} = \\dfrac{-20}{17.89} = -1.118$
$t_{0.05}(19) = 1.729$(左边检验拒绝域为 $T \\leq -1.729$)
因为 $T = -1.118 > -1.729$,不拒绝 $H_0$。
结论:没有充分证据否定厂家的说法。
设 $X_1, X_2, \\ldots, X_n$ 来自 $N(\\mu, \\sigma^2)$,$\\mu$ 未知,检验关于 $\\sigma^2$ 的假设。
检验问题:$H_0: \\sigma^2 = \\sigma_0^2$ vs $H_1: \\sigma^2 \\neq \\sigma_0^2$
检验统计量: $$\\chi^2 = \\frac{(n-1)S^2}{\\sigma_0^2} \\sim \\chi^2(n-1) \\quad (H_0 \\text{ 成立时})$$
拒绝域: $$\\chi^2 \\leq \\chi^2_{1-\\alpha/2}(n-1) \\quad \\text{或} \\quad \\chi^2 \\geq \\chi^2_{\\alpha/2}(n-1)$$
例 7.3:某工厂生产的零件长度方差应不超过0.1。随机抽取25个零件,测得样本方差 $s^2 = 0.16$。检验方差是否符合要求。($\\alpha = 0.05$)
解:
$H_0: \\sigma^2 \\leq 0.1$ vs $H_1: \\sigma^2 > 0.1$(右边检验)
$\\chi^2 = \\dfrac{24 \\times 0.16}{0.1} = 38.4$
$\\chi^2_{0.05}(24) = 36.415$
因为 $38.4 > 36.415$,拒绝 $H_0$。
结论:零件长度的方差显著超过标准。
设两独立样本分别来自 $N(\\mu_1, \\sigma_1^2)$ 和 $N(\\mu_2, \\sigma_2^2)$,$\\sigma_1^2$、$\\sigma_2^2$ 已知。
检验统计量: $$Z = \\frac{(\\bar{X} - \\bar{Y}) - (\\mu_1 - \\mu_2)_0}{\\sqrt{\\dfrac{\\sigma_1^2}{n_1} + \\dfrac{\\sigma_2^2}{n_2}}} \\sim N(0, 1)$$
当 $\\sigma_1^2 = \\sigma_2^2 = \\sigma^2$ 但未知时,使用合并方差。
检验统计量: $$T = \\frac{(\\bar{X} - \\bar{Y}) - (\\mu_1 - \\mu_2)_0}{S_w\\sqrt{\\dfrac{1}{n_1} + \\dfrac{1}{n_2}}} \\sim t(n_1 + n_2 - 2)$$
其中 $S_w^2 = \\dfrac{(n_1-1)S_1^2 + (n_2-1)S_2^2}{n_1 + n_2 - 2}$
例 7.4:比较两种小麦品种的产量。A品种:$n_1 = 10$,$\\bar{x} = 520$,$s_1 = 40$;B品种:$n_2 = 12$,$\\bar{y} = 480$,$s_2 = 35$。假设方差相等,检验两种品种平均产量是否有差异。($\\alpha = 0.05$)
解:
$H_0: \\mu_1 = \\mu_2$ vs $H_1: \\mu_1 \\neq \\mu_2$
$S_w^2 = \\dfrac{9 \\times 40^2 + 11 \\times 35^2}{10 + 12 - 2} = \\dfrac{14400 + 13475}{20} = 1393.75$
$S_w = 37.33$
$T = \\dfrac{520 - 480}{37.33\\sqrt{1/10 + 1/12}} = \\dfrac{40}{16.03} = 2.495$
$t_{0.025}(20) = 2.086$
因为 $|T| = 2.495 > 2.086$,拒绝 $H_0$。
结论:两种小麦品种的平均产量有显著差异。
当 $\\sigma_1^2 \\neq \\sigma_2^2$ 时,使用Welch近似:
检验统计量: $$T = \\frac{\\bar{X} - \\bar{Y}}{\\sqrt{\\dfrac{S_1^2}{n_1} + \\dfrac{S_2^2}{n_2}}}$$
近似服从自由度为 $k$ 的t分布: $$k = \\frac{(S_1^2/n_1 + S_2^2/n_2)^2}{\\dfrac{(S_1^2/n_1)^2}{n_1-1} + \\dfrac{(S_2^2/n_2)^2}{n_2-1}}$$
设两独立样本分别来自 $N(\\mu_1, \\sigma_1^2)$ 和 $N(\\mu_2, \\sigma_2^2)$。
检验问题:$H_0: \\sigma_1^2 = \\sigma_2^2$ vs $H_1: \\sigma_1^2 \\neq \\sigma_2^2$
检验统计量: $$F = \\frac{S_1^2}{S_2^2} \\sim F(n_1-1, n_2-1) \\quad (H_0 \\text{ 成立时})$$
拒绝域: $$F \\leq F_{1-\\alpha/2}(n_1-1, n_2-1) \\quad \\text{或} \\quad F \\geq F_{\\alpha/2}(n_1-1, n_2-1)$$
或等价地: $$F \\geq F_{\\alpha/2}(n_1-1, n_2-1) \\quad \\text{或} \\quad F \\leq \\frac{1}{F_{\\alpha/2}(n_2-1, n_1-1)}$$
当两样本不是独立的,而是成对出现时(如配对实验、前后测量等),需要采用成对t检验。
设 $(X_1, Y_1), (X_2, Y_2), \\ldots, (X_n, Y_n)$ 是成对样本,令 $D_i = X_i - Y_i$。
假设 $D_i \\sim N(\\mu_D, \\sigma_D^2)$,检验 $H_0: \\mu_D = 0$ vs $H_1: \\mu_D \\neq 0$。
检验统计量: $$T = \\frac{\\bar{D}}{S_D/\\sqrt{n}} \\sim t(n-1) \\quad (H_0 \\text{ 成立时})$$
其中 $\\bar{D} = \\dfrac{1}{n}\\sum D_i$,$S_D^2 = \\dfrac{1}{n-1}\\sum(D_i - \\bar{D})^2$。
例 7.5:为检验某种训练方法的效果,对10名学生进行前后测试,成绩如下:
| 学生 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
| — | — | — | — | — | — | — | — | — | — | — |
| 训练前 | 65 | 72 | 58 | 80 | 75 | 68 | 70 | 82 | 60 | 78 |
| 训练后 | 70 | 75 | 65 | 85 | 78 | 72 | 75 | 88 | 68 | 82 |
检验训练是否有效。($\\alpha = 0.05$)
解:
$d_i$:5, 3, 7, 5, 3, 4, 5, 6, 8, 4
$\\bar{d} = 5$,$s_D = 1.563$
$T = \\dfrac{5}{1.563/\\sqrt{10}} = 10.12$
$t_{0.025}(9) = 2.262$
因为 $10.12 > 2.262$,拒绝 $H_0$。
结论:训练方法效果显著。
| 检验对象 | 条件 | 检验统计量 | 分布 | 拒绝域(双边) | ||||
| — | — | — | — | — | ||||
| 单个均值 | $\\sigma | 2$ 已知 | $Z = \\dfrac{\\bar{X}-\\mu_0}{\\sigma/\\sqrt{n}}$ | $N(0,1)$ | $ | Z | \\geq u_{\\alpha/2}$ | |
|---|---|---|---|---|---|---|---|---|
| 单个均值 | $\\sigma | 2$ 未知 | $T = \\dfrac{\\bar{X}-\\mu_0}{S/\\sqrt{n}}$ | $t(n-1)$ | $ | T | \\geq t_{\\alpha/2}(n-1)$ | |
| 单个方差 | $\\mu$ 未知 | $\\chi | 2 = \\dfrac{(n-1)S | 2}{\\sigma_0 | 2}$ | $\\chi | 2(n-1)$ | 太小或太大 |
| 两均值差 | 方差已知 | $Z = \\dfrac{\\bar{X}-\\bar{Y}-\\delta_0}{\\sqrt{\\frac{\\sigma_1 | 2}{n_1}+\\frac{\\sigma_2 | 2}{n_2}}}$ | $N(0,1)$ | $ | Z | \\geq u_{\\alpha/2}$ |
| 两均值差 | 方差相等未知 | $T = \\dfrac{\\bar{X}-\\bar{Y}-\\delta_0}{S_w\\sqrt{\\frac{1}{n_1}+\\frac{1}{n_2}}}$ | $t(n_1+n_2-2)$ | $ | T | \\geq t_{\\alpha/2}$ | ||
| 两方差比 | $\\mu$ 未知 | $F = \\dfrac{S_1 | 2}{S_2 | 2}$ | $F(n_1-1,n_2-1)$ | 太大或太小 |
1. 从正态总体中抽取样本容量为25的样本,测得 $\\bar{x} = 42$,$s = 5$。检验 $H_0: \\mu = 40$ vs $H_1: \\mu \\neq 40$($\\alpha = 0.05$)。
2. 某零件长度应服从 $N(10, 0.01)$。现抽取30个零件,测得平均长度为10.05。检验零件长度是否符合标准($\\alpha = 0.05$)。
3. 两台机器生产同种零件,假设零件长度都服从正态分布。样本数据:机器A:$n_1=16$,$\\bar{x}=20.00$,$s_1^2=0.02$;机器B:$n_2=20$,$\\bar{y}=20.05$,$s_2^2=0.03$。检验两台机器生产的零件长度方差是否相等($\\alpha = 0.05$)。
4. 证明:对于单边检验 $H_0: \\mu \\leq \\mu_0$ vs $H_1: \\mu > \\mu_0$,拒绝域为 $T \\geq t_{\\alpha}(n-1)$ 的检验水平为 $\\alpha$。
5. 设 $X_1, \\ldots, X_n$ 来自 $N(\\mu, \\sigma^2)$,$\\mu$ 和 $\\sigma^2$ 都未知。求检验 $H_0: \\sigma^2 = \\sigma_0^2$ vs $H_1: \\sigma^2 \\neq \\sigma_0^2$ 的拒绝域。
6. 某药厂声称其新药治疗某疾病的有效率至少为85%。在200名患者的临床试验中,160人治愈。检验该厂说法是否成立($\\alpha = 0.05$)。
7. 为比较两种肥料对玉米产量的影响,选择12块条件相似的田地,随机分成两组,每组6块,分别施用两种肥料。产量数据(kg):
肥料A:85, 92, 78, 88, 95, 82 肥料B:75, 80, 72, 85, 78, 74 (a) 假设方差相等,检验两种肥料效果是否有差异; (b) 先检验方差是否相等,再选择适当的检验方法比较均值。
本章介绍了正态总体参数的假设检验方法:
这些方法在实际应用中非常广泛,务必熟练掌握各种检验的条件、统计量和拒绝域。