用户工具

站点工具


数理统计:第六章_假设检验的基本概念

第六章 假设检验的基本概念

6.1 统计假设

6.1.1 假设检验的基本思想

假设检验是统计推断的另一重要内容。与参数估计不同,假设检验是对总体分布或参数提出某种假设,然后利用样本信息判断该假设是否成立。

:某工厂生产的零件标准长度为10cm。现随机抽取一批零件,测得平均长度为10.2cm。问:该批零件的平均长度是否仍为10cm?

6.1.2 统计假设的定义

定义 6.1(统计假设):关于总体分布或总体参数的假设称为统计假设(Statistical Hypothesis)。

假设分为:

  • 原假设(Null Hypothesis):记为 $H_0$,通常表示“无差异”、“无效应”、“现状不变”
  • 备择假设(Alternative Hypothesis):记为 $H_1$ 或 $H_a$,表示与原假设对立的假设

6.2 假设检验的基本步骤

6.2.1 一般步骤

假设检验的一般步骤:

1. **提出假设**:明确原假设 $H_0$ 和备择假设 $H_1$
2. **选择检验统计量**:构造一个不含未知参数的统计量 $T$,且当 $H_0$ 成立时,$T$ 的分布已知
3. **确定拒绝域**:对于给定的显著性水平 $\\alpha$,确定拒绝域 $W$
4. **计算与决策**:根据样本计算检验统计量的值,若落入拒绝域则拒绝 $H_0$,否则不拒绝 $H_0$

6.2.2 假设的类型

(1) 简单假设 vs 复合假设

  • 简单假设:完全确定总体分布的假设,如 $H_0: \\theta = \\theta_0$
  • 复合假设:部分确定总体分布的假设,如 $H_1: \\theta \\neq \\theta_0$、$H_1: \\theta > \\theta_0$ 等

(2) 双边检验 vs 单边检验

  • 双边检验:$H_0: \\theta = \\theta_0$ vs $H_1: \\theta \\neq \\theta_0$
  • 左边检验:$H_0: \\theta \\geq \\theta_0$ vs $H_1: \\theta < \\theta_0$
  • 右边检验:$H_0: \\theta \\leq \\theta_0$ vs $H_1: \\theta > \\theta_0$

6.3 两类错误与显著性水平

6.3.1 两类错误

由于样本的随机性,假设检验可能犯两种错误:

实际情况
决策
接受 $H_0$ 拒绝 $H_0$
$H_0$ 为真 正确 第一类错误
$H_0$ 为假 第二类错误 正确

(1) 第一类错误(Type I Error):$H_0$ 为真时拒绝 $H_0$(“弃真”错误) $$\\alpha = P(\\text{拒绝 } H_0 | H_0 \\text{ 为真}) = P(X \\in W | H_0)$$

(2) 第二类错误(Type II Error):$H_0$ 为假时接受 $H_0$(“取伪”错误) $$\\beta = P(\\text{接受 } H_0 | H_1 \\text{ 为真}) = P(X \\notin W | H_1)$$

6.3.2 两类错误的关系

在样本容量 $n$ 固定时,$\\alpha$ 和 $\\beta$ 不能同时减小:

  • 减小 $\\alpha$(使拒绝域变小)→ 增大 $\\beta$
  • 减小 $\\beta$(使拒绝域变大)→ 增大 $\\alpha$

要同时减小两类错误,必须增加样本容量

6.3.3 显著性水平

定义 6.2(显著性水平):给定一个很小的正数 $\\alpha$(通常取0.05、0.01或0.10),要求检验满足: $$P(\\text{拒绝 } H_0 | H_0 \\text{ 为真}) \\leq \\alpha$$

则称 $\\alpha$ 为显著性水平(Significance Level),称该检验为显著性水平 $\\alpha$ 的检验

6.4 功效函数

6.4.1 功效函数的定义

定义 6.3(功效函数):设 $W$ 是检验的拒绝域,称函数: $$\\beta(\\theta) = P_\\theta(X \\in W)$$ 为检验的功效函数(Power Function)或势函数

功效函数表示当真实参数为 $\\theta$ 时,拒绝 $H_0$ 的概率。

6.4.2 功效与检验

  • 当 $\\theta \\in H_0$ 时,$\\beta(\\theta) = P(\\text{第一类错误})$
  • 当 $\\theta \\in H_1$ 时,$\\beta(\\theta) = 1 - P(\\text{第二类错误}) = 1 - \\beta$ 称为功效(Power)

一个好的检验应该:

  • 当 $\\theta \\in H_0$ 时,$\\beta(\\theta) \\leq \\alpha$
  • 当 $\\theta \\in H_1$ 时,$\\beta(\\theta)$ 尽可能大

6.5 p值

6.5.1 p值的定义

定义 6.4(p值):p值是在原假设 $H_0$ 成立的条件下,得到当前样本结果或更极端结果的概率。

p值可以看作是拒绝 $H_0$ 的“最小显著性水平”。

6.5.2 p值的计算

  • 右边检验:$p = P(T \\geq t | H_0)$
  • 左边检验:$p = P(T \\leq t | H_0)$
  • 双边检验:$p = 2 \\min\\{P(T \\geq t | H_0), P(T \\leq t | H_0)\\}$

6.5.3 p值决策规则

  • 若 $p \\leq \\alpha$,拒绝 $H_0$
  • 若 $p > \\alpha$,不拒绝 $H_0$

使用p值的优点:

  • 提供更精细的信息
  • 不需要预先确定 $\\alpha$
  • 便于比较不同研究的结果

6.6 最佳检验

6.6.1 一致最优势检验(UMP检验)

定义 6.5(UMP检验):对于检验问题 $H_0: \\theta \\in \\Theta_0$ vs $H_1: \\theta \\in \\Theta_1$,若检验的功效函数 $\\beta(\\theta)$ 满足:

  • $\\sup_{\\theta \\in \\Theta_0}\\beta(\\theta) \\leq \\alpha$
  • 对任意水平 $\\alpha$ 的其他检验,有 $\\beta(\\theta) \\geq \\beta^*(\\theta)$ 对所有 $\\theta \\in \\Theta_1$ 成立

则称该检验为一致最优势检验(Uniformly Most Powerful Test, UMP检验)。

6.6.2 Neyman-Pearson引理简介

对于简单假设检验问题 $H_0: \\theta = \\theta_0$ vs $H_1: \\theta = \\theta_1$,Neyman-Pearson引理给出了最优势检验的形式(详见第九章)。

6.7 例题详解

例 6.1:设 $X_1, X_2, \\ldots, X_{25}$ 来自 $N(\\mu, 9)$,检验 $H_0: \\mu = 0$ vs $H_1: \\mu \\neq 0$,拒绝域为 $W = \\{|\\bar{X}| \\geq c\\}$。

(1) 求 $c$ 使得显著性水平为0.05; (2) 求当 $\\mu = 1$ 时,检验的功效。

(1) 在 $H_0$ 下,$\\bar{X} \\sim N(0, 9/25) = N(0, 0.36)$,$\\bar{X}/0.6 \\sim N(0, 1)$。

$$P(|\\bar{X}| \\geq c | \\mu = 0) = 0.05$$

$$P\\left(\\left|\\frac{\\bar{X}}{0.6}\\right| \\geq \\frac{c}{0.6}\\right) = 0.05$$

查表得 $\\dfrac{c}{0.6} = 1.96$,所以 $c = 1.176$。

(2) 当 $\\mu = 1$ 时,$\\bar{X} \\sim N(1, 0.36)$。

功效 $= P(|\\bar{X}| \\geq 1.176 | \\mu = 1)$

$= P(\\bar{X} \\geq 1.176) + P(\\bar{X} \\leq -1.176)$

$= P(Z \\geq \\dfrac{1.176-1}{0.6}) + P(Z \\leq \\dfrac{-1.176-1}{0.6})$

$= P(Z \\geq 0.293) + P(Z \\leq -3.627) \\approx 0.385 + 0.0001 = 0.385$

6.8 习题

基础练习

1. 解释假设检验中两类错误的含义,并说明它们之间的关系。

2. 设检验的拒绝域为 $W$,写出功效函数 $\\beta(\\theta)$ 的定义,并说明 $\\beta(\\theta)$ 在 $H_0$ 和 $H_1$ 下的含义。

3. 什么是p值?如何根据p值做出决策?

4. 为什么当 $n$ 固定时,$\\alpha$ 和 $\\beta$ 不能同时任意小?

进阶练习

5. 设 $X_1, X_2, \\ldots, X_n$ 来自 $N(\\mu, \\sigma^2)$,$\\sigma^2$ 已知。考虑检验 $H_0: \\mu = \\mu_0$ vs $H_1: \\mu > \\mu_0$,拒绝域为 $W = \\{\\bar{X} > c\\}$。

 (a) 求 $c$ 使得检验水平为 $\\alpha$;
 (b) 求功效函数 $\\beta(\\mu)$;
 (c) 当 $n = 25$,$\\sigma = 5$,$\\alpha = 0.05$,$\\mu_0 = 10$,$\\mu = 12$ 时,计算功效。

6. 证明:对于简单假设检验,不存在一个检验使得 $\\alpha = \\beta = 0$(除非样本提供完全信息)。

综合应用

7. 某药物公司声称其新药的有效率为80%。为了验证这一说法,随机抽取100名患者试用该药。

 (a) 建立适当的假设;
 (b) 设观察到75人有效,计算p值并做出结论($\\alpha = 0.05$);
 (c) 若要使检验的功效达到0.90(当真实有效率为70%时),至少需要多大的样本量?

8. 设 $X_1, X_2, \\ldots, X_n$ 来自 $Exp(\\lambda)$,考虑检验 $H_0: \\lambda = \\lambda_0$ vs $H_1: \\lambda \\neq \\lambda_0$。

 (a) 构造适当的检验统计量;
 (b) 确定拒绝域;
 (c) 求功效函数的表达式。

本章小结

本章介绍了假设检验的基本概念:

  • 统计假设:原假设 $H_0$ 和备择假设 $H_1$
  • 两类错误
    1. 第一类错误(弃真):$\\alpha$
    2. 第二类错误(取伪):$\\beta$
  • 显著性水平:控制第一类错误概率
  • 功效函数:$\\beta(\\theta) = P(\\text{拒绝 } H_0 | \\theta)$
  • p值:拒绝 $H_0$ 的最小显著性水平
  • 最佳检验:UMP检验的概念

理解这些基本概念是掌握各种具体检验方法的基础。

数理统计/第六章_假设检验的基本概念.txt · 最后更改: 127.0.0.1