====== 第七章 正态总体参数的假设检验 ====== ===== 7.1 单个正态总体均值的检验 ===== ==== 7.1.1 方差已知时的Z检验 ==== 设 $X_1, X_2, \\ldots, X_n$ 来自 $N(\\mu, \\sigma^2)$,其中 $\\sigma^2$ 已知,检验关于 $\\mu$ 的假设。 **检验问题**:$H_0: \\mu = \\mu_0$ vs $H_1: \\mu \\neq \\mu_0$ **检验统计量**: $$Z = \\frac{\\bar{X} - \\mu_0}{\\sigma/\\sqrt{n}} \\sim N(0, 1) \\quad (H_0 \\text{ 成立时})$$ **拒绝域**(显著性水平 $\\alpha$): $$|Z| \\geq u_{\\alpha/2}$$ 或等价地: $$\\bar{X} \\leq \\mu_0 - \\frac{\\sigma}{\\sqrt{n}}u_{\\alpha/2} \\quad \\text{或} \\quad \\bar{X} \\geq \\mu_0 + \\frac{\\sigma}{\\sqrt{n}}u_{\\alpha/2}$$ **例 7.1**:某工厂生产的零件长度服从 $N(\\mu, 0.5^2)$。标准长度为10cm。现抽取16个零件,测得平均长度为10.3cm。问:零件长度是否偏离标准?($\\alpha = 0.05$) **解**: $H_0: \\mu = 10$ vs $H_1: \\mu \\neq 10$ $Z = \\dfrac{10.3 - 10}{0.5/\\sqrt{16}} = \\dfrac{0.3}{0.125} = 2.4$ $u_{0.025} = 1.96$ 因为 $|Z| = 2.4 > 1.96$,拒绝 $H_0$。 结论:零件平均长度与标准有显著差异。 ==== 7.1.2 方差未知时的t检验 ==== 当 $\\sigma^2$ 未知时,用样本方差 $S^2$ 代替。 **检验统计量**: $$T = \\frac{\\bar{X} - \\mu_0}{S/\\sqrt{n}} \\sim t(n-1) \\quad (H_0 \\text{ 成立时})$$ **拒绝域**: $$|T| \\geq t_{\\alpha/2}(n-1)$$ **例 7.2**:某灯泡厂声称其灯泡平均寿命不低于1000小时。随机抽取20个灯泡测试,测得平均寿命980小时,样本标准差80小时。检验该厂说法是否可信。($\\alpha = 0.05$) **解**: $H_0: \\mu \\geq 1000$ vs $H_1: \\mu < 1000$(左边检验) $T = \\dfrac{980 - 1000}{80/\\sqrt{20}} = \\dfrac{-20}{17.89} = -1.118$ $t_{0.05}(19) = 1.729$(左边检验拒绝域为 $T \\leq -1.729$) 因为 $T = -1.118 > -1.729$,不拒绝 $H_0$。 结论:没有充分证据否定厂家的说法。 ===== 7.2 单个正态总体方差的检验 ===== ==== 7.2.1 均值未知时的$\\chi^2$检验 ==== 设 $X_1, X_2, \\ldots, X_n$ 来自 $N(\\mu, \\sigma^2)$,$\\mu$ 未知,检验关于 $\\sigma^2$ 的假设。 **检验问题**:$H_0: \\sigma^2 = \\sigma_0^2$ vs $H_1: \\sigma^2 \\neq \\sigma_0^2$ **检验统计量**: $$\\chi^2 = \\frac{(n-1)S^2}{\\sigma_0^2} \\sim \\chi^2(n-1) \\quad (H_0 \\text{ 成立时})$$ **拒绝域**: $$\\chi^2 \\leq \\chi^2_{1-\\alpha/2}(n-1) \\quad \\text{或} \\quad \\chi^2 \\geq \\chi^2_{\\alpha/2}(n-1)$$ **例 7.3**:某工厂生产的零件长度方差应不超过0.1。随机抽取25个零件,测得样本方差 $s^2 = 0.16$。检验方差是否符合要求。($\\alpha = 0.05$) **解**: $H_0: \\sigma^2 \\leq 0.1$ vs $H_1: \\sigma^2 > 0.1$(右边检验) $\\chi^2 = \\dfrac{24 \\times 0.16}{0.1} = 38.4$ $\\chi^2_{0.05}(24) = 36.415$ 因为 $38.4 > 36.415$,拒绝 $H_0$。 结论:零件长度的方差显著超过标准。 ===== 7.3 两个正态总体均值差的检验 ===== ==== 7.3.1 方差已知时的Z检验 ==== 设两独立样本分别来自 $N(\\mu_1, \\sigma_1^2)$ 和 $N(\\mu_2, \\sigma_2^2)$,$\\sigma_1^2$、$\\sigma_2^2$ 已知。 **检验统计量**: $$Z = \\frac{(\\bar{X} - \\bar{Y}) - (\\mu_1 - \\mu_2)_0}{\\sqrt{\\dfrac{\\sigma_1^2}{n_1} + \\dfrac{\\sigma_2^2}{n_2}}} \\sim N(0, 1)$$ ==== 7.3.2 方差相等但未知时的t检验 ==== 当 $\\sigma_1^2 = \\sigma_2^2 = \\sigma^2$ 但未知时,使用合并方差。 **检验统计量**: $$T = \\frac{(\\bar{X} - \\bar{Y}) - (\\mu_1 - \\mu_2)_0}{S_w\\sqrt{\\dfrac{1}{n_1} + \\dfrac{1}{n_2}}} \\sim t(n_1 + n_2 - 2)$$ 其中 $S_w^2 = \\dfrac{(n_1-1)S_1^2 + (n_2-1)S_2^2}{n_1 + n_2 - 2}$ **例 7.4**:比较两种小麦品种的产量。A品种:$n_1 = 10$,$\\bar{x} = 520$,$s_1 = 40$;B品种:$n_2 = 12$,$\\bar{y} = 480$,$s_2 = 35$。假设方差相等,检验两种品种平均产量是否有差异。($\\alpha = 0.05$) **解**: $H_0: \\mu_1 = \\mu_2$ vs $H_1: \\mu_1 \\neq \\mu_2$ $S_w^2 = \\dfrac{9 \\times 40^2 + 11 \\times 35^2}{10 + 12 - 2} = \\dfrac{14400 + 13475}{20} = 1393.75$ $S_w = 37.33$ $T = \\dfrac{520 - 480}{37.33\\sqrt{1/10 + 1/12}} = \\dfrac{40}{16.03} = 2.495$ $t_{0.025}(20) = 2.086$ 因为 $|T| = 2.495 > 2.086$,拒绝 $H_0$。 结论:两种小麦品种的平均产量有显著差异。 ==== 7.3.3 方差不等时的近似t检验(Welch检验) ==== 当 $\\sigma_1^2 \\neq \\sigma_2^2$ 时,使用Welch近似: **检验统计量**: $$T = \\frac{\\bar{X} - \\bar{Y}}{\\sqrt{\\dfrac{S_1^2}{n_1} + \\dfrac{S_2^2}{n_2}}}$$ 近似服从自由度为 $k$ 的t分布: $$k = \\frac{(S_1^2/n_1 + S_2^2/n_2)^2}{\\dfrac{(S_1^2/n_1)^2}{n_1-1} + \\dfrac{(S_2^2/n_2)^2}{n_2-1}}$$ ===== 7.4 两个正态总体方差比的检验 ===== ==== 7.4.1 F检验 ==== 设两独立样本分别来自 $N(\\mu_1, \\sigma_1^2)$ 和 $N(\\mu_2, \\sigma_2^2)$。 **检验问题**:$H_0: \\sigma_1^2 = \\sigma_2^2$ vs $H_1: \\sigma_1^2 \\neq \\sigma_2^2$ **检验统计量**: $$F = \\frac{S_1^2}{S_2^2} \\sim F(n_1-1, n_2-1) \\quad (H_0 \\text{ 成立时})$$ **拒绝域**: $$F \\leq F_{1-\\alpha/2}(n_1-1, n_2-1) \\quad \\text{或} \\quad F \\geq F_{\\alpha/2}(n_1-1, n_2-1)$$ 或等价地: $$F \\geq F_{\\alpha/2}(n_1-1, n_2-1) \\quad \\text{或} \\quad F \\leq \\frac{1}{F_{\\alpha/2}(n_2-1, n_1-1)}$$ ===== 7.5 成对数据的检验 ===== ==== 7.5.1 成对t检验 ==== 当两样本不是独立的,而是成对出现时(如配对实验、前后测量等),需要采用成对t检验。 设 $(X_1, Y_1), (X_2, Y_2), \\ldots, (X_n, Y_n)$ 是成对样本,令 $D_i = X_i - Y_i$。 假设 $D_i \\sim N(\\mu_D, \\sigma_D^2)$,检验 $H_0: \\mu_D = 0$ vs $H_1: \\mu_D \\neq 0$。 **检验统计量**: $$T = \\frac{\\bar{D}}{S_D/\\sqrt{n}} \\sim t(n-1) \\quad (H_0 \\text{ 成立时})$$ 其中 $\\bar{D} = \\dfrac{1}{n}\\sum D_i$,$S_D^2 = \\dfrac{1}{n-1}\\sum(D_i - \\bar{D})^2$。 **例 7.5**:为检验某种训练方法的效果,对10名学生进行前后测试,成绩如下: | 学生 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | |---|---|---|---|---|---|---|---|---|---|---| | 训练前 | 65 | 72 | 58 | 80 | 75 | 68 | 70 | 82 | 60 | 78 | | 训练后 | 70 | 75 | 65 | 85 | 78 | 72 | 75 | 88 | 68 | 82 | 检验训练是否有效。($\\alpha = 0.05$) **解**: $d_i$:5, 3, 7, 5, 3, 4, 5, 6, 8, 4 $\\bar{d} = 5$,$s_D = 1.563$ $T = \\dfrac{5}{1.563/\\sqrt{10}} = 10.12$ $t_{0.025}(9) = 2.262$ 因为 $10.12 > 2.262$,拒绝 $H_0$。 结论:训练方法效果显著。 ===== 7.6 正态总体假设检验汇总 ===== | 检验对象 | 条件 | 检验统计量 | 分布 | 拒绝域(双边) | |---|---|---|---|---| | 单个均值 | $\\sigma^2$ 已知 | $Z = \\dfrac{\\bar{X}-\\mu_0}{\\sigma/\\sqrt{n}}$ | $N(0,1)$ | $|Z| \\geq u_{\\alpha/2}$ | | 单个均值 | $\\sigma^2$ 未知 | $T = \\dfrac{\\bar{X}-\\mu_0}{S/\\sqrt{n}}$ | $t(n-1)$ | $|T| \\geq t_{\\alpha/2}(n-1)$ | | 单个方差 | $\\mu$ 未知 | $\\chi^2 = \\dfrac{(n-1)S^2}{\\sigma_0^2}$ | $\\chi^2(n-1)$ | 太小或太大 | | 两均值差 | 方差已知 | $Z = \\dfrac{\\bar{X}-\\bar{Y}-\\delta_0}{\\sqrt{\\frac{\\sigma_1^2}{n_1}+\\frac{\\sigma_2^2}{n_2}}}$ | $N(0,1)$ | $|Z| \\geq u_{\\alpha/2}$ | | 两均值差 | 方差相等未知 | $T = \\dfrac{\\bar{X}-\\bar{Y}-\\delta_0}{S_w\\sqrt{\\frac{1}{n_1}+\\frac{1}{n_2}}}$ | $t(n_1+n_2-2)$ | $|T| \\geq t_{\\alpha/2}$ | | 两方差比 | $\\mu$ 未知 | $F = \\dfrac{S_1^2}{S_2^2}$ | $F(n_1-1,n_2-1)$ | 太大或太小 | ===== 7.7 习题 ===== ==== 基础练习 ==== 1. 从正态总体中抽取样本容量为25的样本,测得 $\\bar{x} = 42$,$s = 5$。检验 $H_0: \\mu = 40$ vs $H_1: \\mu \\neq 40$($\\alpha = 0.05$)。 2. 某零件长度应服从 $N(10, 0.01)$。现抽取30个零件,测得平均长度为10.05。检验零件长度是否符合标准($\\alpha = 0.05$)。 3. 两台机器生产同种零件,假设零件长度都服从正态分布。样本数据:机器A:$n_1=16$,$\\bar{x}=20.00$,$s_1^2=0.02$;机器B:$n_2=20$,$\\bar{y}=20.05$,$s_2^2=0.03$。检验两台机器生产的零件长度方差是否相等($\\alpha = 0.05$)。 ==== 进阶练习 ==== 4. 证明:对于单边检验 $H_0: \\mu \\leq \\mu_0$ vs $H_1: \\mu > \\mu_0$,拒绝域为 $T \\geq t_{\\alpha}(n-1)$ 的检验水平为 $\\alpha$。 5. 设 $X_1, \\ldots, X_n$ 来自 $N(\\mu, \\sigma^2)$,$\\mu$ 和 $\\sigma^2$ 都未知。求检验 $H_0: \\sigma^2 = \\sigma_0^2$ vs $H_1: \\sigma^2 \\neq \\sigma_0^2$ 的拒绝域。 ==== 综合应用 ==== 6. 某药厂声称其新药治疗某疾病的有效率至少为85%。在200名患者的临床试验中,160人治愈。检验该厂说法是否成立($\\alpha = 0.05$)。 7. 为比较两种肥料对玉米产量的影响,选择12块条件相似的田地,随机分成两组,每组6块,分别施用两种肥料。产量数据(kg): 肥料A:85, 92, 78, 88, 95, 82 肥料B:75, 80, 72, 85, 78, 74 (a) 假设方差相等,检验两种肥料效果是否有差异; (b) 先检验方差是否相等,再选择适当的检验方法比较均值。 ===== 本章小结 ===== 本章介绍了正态总体参数的假设检验方法: * **单个正态总体**: - 均值检验:Z检验(方差已知)、t检验(方差未知) - 方差检验:$\\chi^2$检验 * **两个正态总体**: - 均值差检验:Z检验(方差已知)、t检验(方差相等或Welch检验) - 方差比检验:F检验 * **成对数据**:成对t检验 这些方法在实际应用中非常广泛,务必熟练掌握各种检验的条件、统计量和拒绝域。