目录

第七章 正态总体参数的假设检验

7.1 单个正态总体均值的检验

7.1.1 方差已知时的Z检验

设 $X_1, X_2, \\ldots, X_n$ 来自 $N(\\mu, \\sigma^2)$,其中 $\\sigma^2$ 已知,检验关于 $\\mu$ 的假设。

检验问题:$H_0: \\mu = \\mu_0$ vs $H_1: \\mu \\neq \\mu_0$

检验统计量: $$Z = \\frac{\\bar{X} - \\mu_0}{\\sigma/\\sqrt{n}} \\sim N(0, 1) \\quad (H_0 \\text{ 成立时})$$

拒绝域(显著性水平 $\\alpha$): $$|Z| \\geq u_{\\alpha/2}$$

或等价地: $$\\bar{X} \\leq \\mu_0 - \\frac{\\sigma}{\\sqrt{n}}u_{\\alpha/2} \\quad \\text{或} \\quad \\bar{X} \\geq \\mu_0 + \\frac{\\sigma}{\\sqrt{n}}u_{\\alpha/2}$$

例 7.1:某工厂生产的零件长度服从 $N(\\mu, 0.5^2)$。标准长度为10cm。现抽取16个零件,测得平均长度为10.3cm。问:零件长度是否偏离标准?($\\alpha = 0.05$)

$H_0: \\mu = 10$ vs $H_1: \\mu \\neq 10$

$Z = \\dfrac{10.3 - 10}{0.5/\\sqrt{16}} = \\dfrac{0.3}{0.125} = 2.4$

$u_{0.025} = 1.96$

因为 $|Z| = 2.4 > 1.96$,拒绝 $H_0$。

结论:零件平均长度与标准有显著差异。

7.1.2 方差未知时的t检验

当 $\\sigma^2$ 未知时,用样本方差 $S^2$ 代替。

检验统计量: $$T = \\frac{\\bar{X} - \\mu_0}{S/\\sqrt{n}} \\sim t(n-1) \\quad (H_0 \\text{ 成立时})$$

拒绝域: $$|T| \\geq t_{\\alpha/2}(n-1)$$

例 7.2:某灯泡厂声称其灯泡平均寿命不低于1000小时。随机抽取20个灯泡测试,测得平均寿命980小时,样本标准差80小时。检验该厂说法是否可信。($\\alpha = 0.05$)

$H_0: \\mu \\geq 1000$ vs $H_1: \\mu < 1000$(左边检验)

$T = \\dfrac{980 - 1000}{80/\\sqrt{20}} = \\dfrac{-20}{17.89} = -1.118$

$t_{0.05}(19) = 1.729$(左边检验拒绝域为 $T \\leq -1.729$)

因为 $T = -1.118 > -1.729$,不拒绝 $H_0$。

结论:没有充分证据否定厂家的说法。

7.2 单个正态总体方差的检验

7.2.1 均值未知时的$\\chi^2$检验

设 $X_1, X_2, \\ldots, X_n$ 来自 $N(\\mu, \\sigma^2)$,$\\mu$ 未知,检验关于 $\\sigma^2$ 的假设。

检验问题:$H_0: \\sigma^2 = \\sigma_0^2$ vs $H_1: \\sigma^2 \\neq \\sigma_0^2$

检验统计量: $$\\chi^2 = \\frac{(n-1)S^2}{\\sigma_0^2} \\sim \\chi^2(n-1) \\quad (H_0 \\text{ 成立时})$$

拒绝域: $$\\chi^2 \\leq \\chi^2_{1-\\alpha/2}(n-1) \\quad \\text{或} \\quad \\chi^2 \\geq \\chi^2_{\\alpha/2}(n-1)$$

例 7.3:某工厂生产的零件长度方差应不超过0.1。随机抽取25个零件,测得样本方差 $s^2 = 0.16$。检验方差是否符合要求。($\\alpha = 0.05$)

$H_0: \\sigma^2 \\leq 0.1$ vs $H_1: \\sigma^2 > 0.1$(右边检验)

$\\chi^2 = \\dfrac{24 \\times 0.16}{0.1} = 38.4$

$\\chi^2_{0.05}(24) = 36.415$

因为 $38.4 > 36.415$,拒绝 $H_0$。

结论:零件长度的方差显著超过标准。

7.3 两个正态总体均值差的检验

7.3.1 方差已知时的Z检验

设两独立样本分别来自 $N(\\mu_1, \\sigma_1^2)$ 和 $N(\\mu_2, \\sigma_2^2)$,$\\sigma_1^2$、$\\sigma_2^2$ 已知。

检验统计量: $$Z = \\frac{(\\bar{X} - \\bar{Y}) - (\\mu_1 - \\mu_2)_0}{\\sqrt{\\dfrac{\\sigma_1^2}{n_1} + \\dfrac{\\sigma_2^2}{n_2}}} \\sim N(0, 1)$$

7.3.2 方差相等但未知时的t检验

当 $\\sigma_1^2 = \\sigma_2^2 = \\sigma^2$ 但未知时,使用合并方差。

检验统计量: $$T = \\frac{(\\bar{X} - \\bar{Y}) - (\\mu_1 - \\mu_2)_0}{S_w\\sqrt{\\dfrac{1}{n_1} + \\dfrac{1}{n_2}}} \\sim t(n_1 + n_2 - 2)$$

其中 $S_w^2 = \\dfrac{(n_1-1)S_1^2 + (n_2-1)S_2^2}{n_1 + n_2 - 2}$

例 7.4:比较两种小麦品种的产量。A品种:$n_1 = 10$,$\\bar{x} = 520$,$s_1 = 40$;B品种:$n_2 = 12$,$\\bar{y} = 480$,$s_2 = 35$。假设方差相等,检验两种品种平均产量是否有差异。($\\alpha = 0.05$)

$H_0: \\mu_1 = \\mu_2$ vs $H_1: \\mu_1 \\neq \\mu_2$

$S_w^2 = \\dfrac{9 \\times 40^2 + 11 \\times 35^2}{10 + 12 - 2} = \\dfrac{14400 + 13475}{20} = 1393.75$

$S_w = 37.33$

$T = \\dfrac{520 - 480}{37.33\\sqrt{1/10 + 1/12}} = \\dfrac{40}{16.03} = 2.495$

$t_{0.025}(20) = 2.086$

因为 $|T| = 2.495 > 2.086$,拒绝 $H_0$。

结论:两种小麦品种的平均产量有显著差异。

7.3.3 方差不等时的近似t检验(Welch检验)

当 $\\sigma_1^2 \\neq \\sigma_2^2$ 时,使用Welch近似:

检验统计量: $$T = \\frac{\\bar{X} - \\bar{Y}}{\\sqrt{\\dfrac{S_1^2}{n_1} + \\dfrac{S_2^2}{n_2}}}$$

近似服从自由度为 $k$ 的t分布: $$k = \\frac{(S_1^2/n_1 + S_2^2/n_2)^2}{\\dfrac{(S_1^2/n_1)^2}{n_1-1} + \\dfrac{(S_2^2/n_2)^2}{n_2-1}}$$

7.4 两个正态总体方差比的检验

7.4.1 F检验

设两独立样本分别来自 $N(\\mu_1, \\sigma_1^2)$ 和 $N(\\mu_2, \\sigma_2^2)$。

检验问题:$H_0: \\sigma_1^2 = \\sigma_2^2$ vs $H_1: \\sigma_1^2 \\neq \\sigma_2^2$

检验统计量: $$F = \\frac{S_1^2}{S_2^2} \\sim F(n_1-1, n_2-1) \\quad (H_0 \\text{ 成立时})$$

拒绝域: $$F \\leq F_{1-\\alpha/2}(n_1-1, n_2-1) \\quad \\text{或} \\quad F \\geq F_{\\alpha/2}(n_1-1, n_2-1)$$

或等价地: $$F \\geq F_{\\alpha/2}(n_1-1, n_2-1) \\quad \\text{或} \\quad F \\leq \\frac{1}{F_{\\alpha/2}(n_2-1, n_1-1)}$$

7.5 成对数据的检验

7.5.1 成对t检验

当两样本不是独立的,而是成对出现时(如配对实验、前后测量等),需要采用成对t检验。

设 $(X_1, Y_1), (X_2, Y_2), \\ldots, (X_n, Y_n)$ 是成对样本,令 $D_i = X_i - Y_i$。

假设 $D_i \\sim N(\\mu_D, \\sigma_D^2)$,检验 $H_0: \\mu_D = 0$ vs $H_1: \\mu_D \\neq 0$。

检验统计量: $$T = \\frac{\\bar{D}}{S_D/\\sqrt{n}} \\sim t(n-1) \\quad (H_0 \\text{ 成立时})$$

其中 $\\bar{D} = \\dfrac{1}{n}\\sum D_i$,$S_D^2 = \\dfrac{1}{n-1}\\sum(D_i - \\bar{D})^2$。

例 7.5:为检验某种训练方法的效果,对10名学生进行前后测试,成绩如下:

学生 1 2 3 4 5 6 7 8 9 10
训练前 65 72 58 80 75 68 70 82 60 78
训练后 70 75 65 85 78 72 75 88 68 82

检验训练是否有效。($\\alpha = 0.05$)

$d_i$:5, 3, 7, 5, 3, 4, 5, 6, 8, 4

$\\bar{d} = 5$,$s_D = 1.563$

$T = \\dfrac{5}{1.563/\\sqrt{10}} = 10.12$

$t_{0.025}(9) = 2.262$

因为 $10.12 > 2.262$,拒绝 $H_0$。

结论:训练方法效果显著。

7.6 正态总体假设检验汇总

检验对象 条件 检验统计量 分布 拒绝域(双边)
单个均值 $\\sigma2$ 已知 $Z = \\dfrac{\\bar{X}-\\mu_0}{\\sigma/\\sqrt{n}}$ $N(0,1)$ $Z \\geq u_{\\alpha/2}$
单个均值 $\\sigma2$ 未知 $T = \\dfrac{\\bar{X}-\\mu_0}{S/\\sqrt{n}}$ $t(n-1)$ $T \\geq t_{\\alpha/2}(n-1)$
单个方差 $\\mu$ 未知 $\\chi2 = \\dfrac{(n-1)S2}{\\sigma_02}$ $\\chi2(n-1)$ 太小或太大
两均值差 方差已知 $Z = \\dfrac{\\bar{X}-\\bar{Y}-\\delta_0}{\\sqrt{\\frac{\\sigma_12}{n_1}+\\frac{\\sigma_22}{n_2}}}$ $N(0,1)$ $Z \\geq u_{\\alpha/2}$
两均值差 方差相等未知 $T = \\dfrac{\\bar{X}-\\bar{Y}-\\delta_0}{S_w\\sqrt{\\frac{1}{n_1}+\\frac{1}{n_2}}}$ $t(n_1+n_2-2)$ $T \\geq t_{\\alpha/2}$
两方差比 $\\mu$ 未知 $F = \\dfrac{S_12}{S_22}$ $F(n_1-1,n_2-1)$ 太大或太小

7.7 习题

基础练习

1. 从正态总体中抽取样本容量为25的样本,测得 $\\bar{x} = 42$,$s = 5$。检验 $H_0: \\mu = 40$ vs $H_1: \\mu \\neq 40$($\\alpha = 0.05$)。

2. 某零件长度应服从 $N(10, 0.01)$。现抽取30个零件,测得平均长度为10.05。检验零件长度是否符合标准($\\alpha = 0.05$)。

3. 两台机器生产同种零件,假设零件长度都服从正态分布。样本数据:机器A:$n_1=16$,$\\bar{x}=20.00$,$s_1^2=0.02$;机器B:$n_2=20$,$\\bar{y}=20.05$,$s_2^2=0.03$。检验两台机器生产的零件长度方差是否相等($\\alpha = 0.05$)。

进阶练习

4. 证明:对于单边检验 $H_0: \\mu \\leq \\mu_0$ vs $H_1: \\mu > \\mu_0$,拒绝域为 $T \\geq t_{\\alpha}(n-1)$ 的检验水平为 $\\alpha$。

5. 设 $X_1, \\ldots, X_n$ 来自 $N(\\mu, \\sigma^2)$,$\\mu$ 和 $\\sigma^2$ 都未知。求检验 $H_0: \\sigma^2 = \\sigma_0^2$ vs $H_1: \\sigma^2 \\neq \\sigma_0^2$ 的拒绝域。

综合应用

6. 某药厂声称其新药治疗某疾病的有效率至少为85%。在200名患者的临床试验中,160人治愈。检验该厂说法是否成立($\\alpha = 0.05$)。

7. 为比较两种肥料对玉米产量的影响,选择12块条件相似的田地,随机分成两组,每组6块,分别施用两种肥料。产量数据(kg):

 肥料A:85, 92, 78, 88, 95, 82
 肥料B:75, 80, 72, 85, 78, 74
 (a) 假设方差相等,检验两种肥料效果是否有差异;
 (b) 先检验方差是否相等,再选择适当的检验方法比较均值。

本章小结

本章介绍了正态总体参数的假设检验方法:

这些方法在实际应用中非常广泛,务必熟练掌握各种检验的条件、统计量和拒绝域。