目录
第六章 假设检验的基本概念
6.1 统计假设
6.1.1 假设检验的基本思想
假设检验是统计推断的另一重要内容。与参数估计不同,假设检验是对总体分布或参数提出某种假设,然后利用样本信息判断该假设是否成立。
例:某工厂生产的零件标准长度为10cm。现随机抽取一批零件,测得平均长度为10.2cm。问:该批零件的平均长度是否仍为10cm?
6.1.2 统计假设的定义
定义 6.1(统计假设):关于总体分布或总体参数的假设称为统计假设(Statistical Hypothesis)。
假设分为:
- 原假设(Null Hypothesis):记为 $H_0$,通常表示“无差异”、“无效应”、“现状不变”
- 备择假设(Alternative Hypothesis):记为 $H_1$ 或 $H_a$,表示与原假设对立的假设
6.2 假设检验的基本步骤
6.2.1 一般步骤
假设检验的一般步骤:
1. **提出假设**:明确原假设 $H_0$ 和备择假设 $H_1$ 2. **选择检验统计量**:构造一个不含未知参数的统计量 $T$,且当 $H_0$ 成立时,$T$ 的分布已知 3. **确定拒绝域**:对于给定的显著性水平 $\\alpha$,确定拒绝域 $W$ 4. **计算与决策**:根据样本计算检验统计量的值,若落入拒绝域则拒绝 $H_0$,否则不拒绝 $H_0$
6.2.2 假设的类型
(1) 简单假设 vs 复合假设:
- 简单假设:完全确定总体分布的假设,如 $H_0: \\theta = \\theta_0$
- 复合假设:部分确定总体分布的假设,如 $H_1: \\theta \\neq \\theta_0$、$H_1: \\theta > \\theta_0$ 等
(2) 双边检验 vs 单边检验:
- 双边检验:$H_0: \\theta = \\theta_0$ vs $H_1: \\theta \\neq \\theta_0$
- 左边检验:$H_0: \\theta \\geq \\theta_0$ vs $H_1: \\theta < \\theta_0$
- 右边检验:$H_0: \\theta \\leq \\theta_0$ vs $H_1: \\theta > \\theta_0$
6.3 两类错误与显著性水平
6.3.1 两类错误
由于样本的随机性,假设检验可能犯两种错误:
| 实际情况 决策 | 接受 $H_0$ | 拒绝 $H_0$ |
| — | — | — |
| $H_0$ 为真 | 正确 | 第一类错误 |
| $H_0$ 为假 | 第二类错误 | 正确 |
(1) 第一类错误(Type I Error):$H_0$ 为真时拒绝 $H_0$(“弃真”错误) $$\\alpha = P(\\text{拒绝 } H_0 | H_0 \\text{ 为真}) = P(X \\in W | H_0)$$
(2) 第二类错误(Type II Error):$H_0$ 为假时接受 $H_0$(“取伪”错误) $$\\beta = P(\\text{接受 } H_0 | H_1 \\text{ 为真}) = P(X \\notin W | H_1)$$
6.3.2 两类错误的关系
在样本容量 $n$ 固定时,$\\alpha$ 和 $\\beta$ 不能同时减小:
- 减小 $\\alpha$(使拒绝域变小)→ 增大 $\\beta$
- 减小 $\\beta$(使拒绝域变大)→ 增大 $\\alpha$
要同时减小两类错误,必须增加样本容量。
6.3.3 显著性水平
定义 6.2(显著性水平):给定一个很小的正数 $\\alpha$(通常取0.05、0.01或0.10),要求检验满足: $$P(\\text{拒绝 } H_0 | H_0 \\text{ 为真}) \\leq \\alpha$$
则称 $\\alpha$ 为显著性水平(Significance Level),称该检验为显著性水平 $\\alpha$ 的检验。
6.4 功效函数
6.4.1 功效函数的定义
定义 6.3(功效函数):设 $W$ 是检验的拒绝域,称函数: $$\\beta(\\theta) = P_\\theta(X \\in W)$$ 为检验的功效函数(Power Function)或势函数。
功效函数表示当真实参数为 $\\theta$ 时,拒绝 $H_0$ 的概率。
6.4.2 功效与检验
- 当 $\\theta \\in H_0$ 时,$\\beta(\\theta) = P(\\text{第一类错误})$
- 当 $\\theta \\in H_1$ 时,$\\beta(\\theta) = 1 - P(\\text{第二类错误}) = 1 - \\beta$ 称为功效(Power)
一个好的检验应该:
- 当 $\\theta \\in H_0$ 时,$\\beta(\\theta) \\leq \\alpha$
- 当 $\\theta \\in H_1$ 时,$\\beta(\\theta)$ 尽可能大
6.5 p值
6.5.1 p值的定义
定义 6.4(p值):p值是在原假设 $H_0$ 成立的条件下,得到当前样本结果或更极端结果的概率。
p值可以看作是拒绝 $H_0$ 的“最小显著性水平”。
6.5.2 p值的计算
- 右边检验:$p = P(T \\geq t | H_0)$
- 左边检验:$p = P(T \\leq t | H_0)$
- 双边检验:$p = 2 \\min\\{P(T \\geq t | H_0), P(T \\leq t | H_0)\\}$
6.5.3 p值决策规则
- 若 $p \\leq \\alpha$,拒绝 $H_0$
- 若 $p > \\alpha$,不拒绝 $H_0$
使用p值的优点:
- 提供更精细的信息
- 不需要预先确定 $\\alpha$
- 便于比较不同研究的结果
6.6 最佳检验
6.6.1 一致最优势检验(UMP检验)
定义 6.5(UMP检验):对于检验问题 $H_0: \\theta \\in \\Theta_0$ vs $H_1: \\theta \\in \\Theta_1$,若检验的功效函数 $\\beta(\\theta)$ 满足:
- $\\sup_{\\theta \\in \\Theta_0}\\beta(\\theta) \\leq \\alpha$
- 对任意水平 $\\alpha$ 的其他检验,有 $\\beta(\\theta) \\geq \\beta^*(\\theta)$ 对所有 $\\theta \\in \\Theta_1$ 成立
则称该检验为一致最优势检验(Uniformly Most Powerful Test, UMP检验)。
6.6.2 Neyman-Pearson引理简介
对于简单假设检验问题 $H_0: \\theta = \\theta_0$ vs $H_1: \\theta = \\theta_1$,Neyman-Pearson引理给出了最优势检验的形式(详见第九章)。
6.7 例题详解
例 6.1:设 $X_1, X_2, \\ldots, X_{25}$ 来自 $N(\\mu, 9)$,检验 $H_0: \\mu = 0$ vs $H_1: \\mu \\neq 0$,拒绝域为 $W = \\{|\\bar{X}| \\geq c\\}$。
(1) 求 $c$ 使得显著性水平为0.05; (2) 求当 $\\mu = 1$ 时,检验的功效。
解:
(1) 在 $H_0$ 下,$\\bar{X} \\sim N(0, 9/25) = N(0, 0.36)$,$\\bar{X}/0.6 \\sim N(0, 1)$。
$$P(|\\bar{X}| \\geq c | \\mu = 0) = 0.05$$
$$P\\left(\\left|\\frac{\\bar{X}}{0.6}\\right| \\geq \\frac{c}{0.6}\\right) = 0.05$$
查表得 $\\dfrac{c}{0.6} = 1.96$,所以 $c = 1.176$。
(2) 当 $\\mu = 1$ 时,$\\bar{X} \\sim N(1, 0.36)$。
功效 $= P(|\\bar{X}| \\geq 1.176 | \\mu = 1)$
$= P(\\bar{X} \\geq 1.176) + P(\\bar{X} \\leq -1.176)$
$= P(Z \\geq \\dfrac{1.176-1}{0.6}) + P(Z \\leq \\dfrac{-1.176-1}{0.6})$
$= P(Z \\geq 0.293) + P(Z \\leq -3.627) \\approx 0.385 + 0.0001 = 0.385$
6.8 习题
基础练习
1. 解释假设检验中两类错误的含义,并说明它们之间的关系。
2. 设检验的拒绝域为 $W$,写出功效函数 $\\beta(\\theta)$ 的定义,并说明 $\\beta(\\theta)$ 在 $H_0$ 和 $H_1$ 下的含义。
3. 什么是p值?如何根据p值做出决策?
4. 为什么当 $n$ 固定时,$\\alpha$ 和 $\\beta$ 不能同时任意小?
进阶练习
5. 设 $X_1, X_2, \\ldots, X_n$ 来自 $N(\\mu, \\sigma^2)$,$\\sigma^2$ 已知。考虑检验 $H_0: \\mu = \\mu_0$ vs $H_1: \\mu > \\mu_0$,拒绝域为 $W = \\{\\bar{X} > c\\}$。
(a) 求 $c$ 使得检验水平为 $\\alpha$; (b) 求功效函数 $\\beta(\\mu)$; (c) 当 $n = 25$,$\\sigma = 5$,$\\alpha = 0.05$,$\\mu_0 = 10$,$\\mu = 12$ 时,计算功效。
6. 证明:对于简单假设检验,不存在一个检验使得 $\\alpha = \\beta = 0$(除非样本提供完全信息)。
综合应用
7. 某药物公司声称其新药的有效率为80%。为了验证这一说法,随机抽取100名患者试用该药。
(a) 建立适当的假设; (b) 设观察到75人有效,计算p值并做出结论($\\alpha = 0.05$); (c) 若要使检验的功效达到0.90(当真实有效率为70%时),至少需要多大的样本量?
8. 设 $X_1, X_2, \\ldots, X_n$ 来自 $Exp(\\lambda)$,考虑检验 $H_0: \\lambda = \\lambda_0$ vs $H_1: \\lambda \\neq \\lambda_0$。
(a) 构造适当的检验统计量; (b) 确定拒绝域; (c) 求功效函数的表达式。
本章小结
本章介绍了假设检验的基本概念:
- 统计假设:原假设 $H_0$ 和备择假设 $H_1$
- 两类错误:
- 第一类错误(弃真):$\\alpha$
- 第二类错误(取伪):$\\beta$
- 显著性水平:控制第一类错误概率
- 功效函数:$\\beta(\\theta) = P(\\text{拒绝 } H_0 | \\theta)$
- p值:拒绝 $H_0$ 的最小显著性水平
- 最佳检验:UMP检验的概念
理解这些基本概念是掌握各种具体检验方法的基础。
