====== 第一章 概率论基础 ====== ===== 1.1 随机事件与样本空间 ===== ==== 1.1.1 随机现象与随机试验 ==== **确定性现象:** 在一定条件下必然发生或不发生的现象。 - 例:标准大气压下,水加热到 100°C 必然沸腾 **随机现象:** 在一定条件下,可能出现多种结果,且事先不能确定哪一种结果会出现的现象。 - 例:掷一枚硬币,结果可能是正面或反面 - 例:测量某零件的长度,结果在一定范围内波动 **随机试验(简称试验):** 具有以下特征的试验称为随机试验: 1. 可在相同条件下重复进行 2. 每次试验的可能结果不止一个,且事先明确所有可能结果 3. 进行一次试验之前不能确定哪一个结果会出现 **例 1.1** 常见的随机试验: - $E_1$:抛一枚硬币,观察正反面 - $E_2$:掷一颗骰子,观察出现的点数 - $E_3$:记录某电话交换台一分钟内接到的呼叫次数 - $E_4$:测量某灯泡的寿命 ==== 1.1.2 样本空间与随机事件 ==== **定义 1.1(样本空间)** 随机试验 $E$ 的**所有可能结果**组成的集合称为 $E$ 的**样本空间**,记为 $\Omega$ 或 $S$。样本空间的元素(即 $E$ 的每个结果)称为**样本点**。 **例 1.2** - $E_1$(抛硬币):$\Omega_1 = \{H, T\}$($H$ 表示正面,$T$ 表示反面) - $E_2$(掷骰子):$\Omega_2 = \{1, 2, 3, 4, 5, 6\}$ - $E_3$(呼叫次数):$\Omega_3 = \{0, 1, 2, \ldots\}$ - $E_4$(灯泡寿命):$\Omega_4 = \{t : t \geq 0\} = [0, +\infty)$ **定义 1.2(随机事件)** 试验 $E$ 的样本空间 $\Omega$ 的**子集**称为 $E$ 的**随机事件**,简称**事件**。只含一个样本点的事件称为**基本事件**。 **事件的分类:** - **必然事件**:在每次试验中必然发生,即 $\Omega$ 本身 - **不可能事件**:在每次试验中都不发生,即空集 $\emptyset$ **例 1.3** 掷骰子试验 $E_2$: - 事件 $A$:"出现偶数点" = $\{2, 4, 6\}$ - 事件 $B$:"出现点数大于 4" = $\{5, 6\}$ - 事件 $C$:"出现点数小于 7" = $\{1, 2, 3, 4, 5, 6\} = \Omega$(必然事件) - 事件 $D$:"出现点数大于 6" = $\emptyset$(不可能事件) ===== 1.2 事件的关系与运算 ===== ==== 1.2.1 事件的关系 ==== 设试验 $E$ 的样本空间为 $\Omega$,$A, B$ 是 $E$ 的事件。 **1. 包含关系** 若 $A \subseteq B$,则称事件 $B$ **包含**事件 $A$,或事件 $A$ **包含于**事件 $B$。 - 含义:$A$ 发生则 $B$ 必发生 **2. 相等关系** 若 $A \subseteq B$ 且 $B \subseteq A$,则称事件 $A$ 与事件 $B$ **相等**,记为 $A = B$。 **3. 互斥关系(互不相容)** 若 $A \cap B = \emptyset$,则称事件 $A$ 与事件 $B$ **互斥**或**互不相容**。 - 含义:$A$ 与 $B$ 不能同时发生 **4. 对立关系** 若 $A \cap B = \emptyset$ 且 $A \cup B = \Omega$,则称事件 $A$ 与事件 $B$ **互为对立事件**。 - 记 $B = \overline{A}$ 或 $A^c$,表示"$A$ 不发生" ==== 1.2.2 事件的运算 ==== **1. 和事件(并)** $A \cup B = \{x : x \in A \text{ 或 } x \in B\}$ - 含义:$A$ 与 $B$ 至少有一个发生 **推广:** $\bigcup_{i=1}^n A_i$ 表示 $A_1, A_2, \ldots, A_n$ 至少有一个发生 **2. 积事件(交)** $A \cap B = AB = \{x : x \in A \text{ 且 } x \in B\}$ - 含义:$A$ 与 $B$ 同时发生 **3. 差事件** $A - B = A\overline{B} = \{x : x \in A \text{ 且 } x \notin B\}$ - 含义:$A$ 发生而 $B$ 不发生 **4. 完备事件组** 若 $A_1, A_2, \ldots, A_n$ 满足: - $A_i \cap A_j = \emptyset$($i \neq j$,两两互斥) - $\bigcup_{i=1}^n A_i = \Omega$ 则称 $A_1, A_2, \ldots, A_n$ 为 $\Omega$ 的一个**划分**或**完备事件组**。 ==== 1.2.3 事件的运算律 ==== **1. 交换律:** $$A \cup B = B \cup A, \quad A \cap B = B \cap A$$ **2. 结合律:** $$(A \cup B) \cup C = A \cup (B \cup C), \quad (A \cap B) \cap C = A \cap (B \cap C)$$ **3. 分配律:** $$A \cap (B \cup C) = (A \cap B) \cup (A \cap C)$$ $$A \cup (B \cap C) = (A \cup B) \cap (A \cup C)$$ **4. 德摩根律(对偶律):** $$\overline{A \cup B} = \overline{A} \cap \overline{B}, \quad \overline{A \cap B} = \overline{A} \cup \overline{B}$$ 推广形式: $$\overline{\bigcup_{i=1}^n A_i} = \bigcap_{i=1}^n \overline{A_i}, \quad \overline{\bigcap_{i=1}^n A_i} = \bigcup_{i=1}^n \overline{A_i}$$ **例 1.4** 设 $A, B, C$ 是三个事件,用 $A, B, C$ 的运算关系表示下列事件: (1) $A$ 发生,$B$ 与 $C$ 不发生:$A\overline{B}\overline{C}$ 或 $A - (B \cup C)$ (2) $A$ 与 $B$ 都发生,$C$ 不发生:$AB\overline{C}$ 或 $AB - C$ (3) $A, B, C$ 都发生:$ABC$ (4) $A, B, C$ 至少有一个发生:$A \cup B \cup C$ (5) $A, B, C$ 都不发生:$\overline{A}\overline{B}\overline{C}$ 或 $\overline{A \cup B \cup C}$ (6) $A, B, C$ 不多于一个发生:$\overline{A}\overline{B}\overline{C} \cup A\overline{B}\overline{C} \cup \overline{A}B\overline{C} \cup \overline{A}\overline{B}C$ ===== 1.3 概率的定义与性质 ===== ==== 1.3.1 频率与概率的统计定义 ==== **定义 1.3(频率)** 在相同的条件下进行 $n$ 次试验,事件 $A$ 发生的次数 $n_A$ 称为 $A$ 的**频数**,比值 $\frac{n_A}{n}$ 称为 $A$ 的**频率**,记为 $f_n(A)$。 **频率的性质:** 1. $0 \leq f_n(A) \leq 1$ 2. $f_n(\Omega) = 1$,$f_n(\emptyset) = 0$ 3. 若 $A, B$ 互斥,则 $f_n(A \cup B) = f_n(A) + f_n(B)$ **频率的稳定性:** 当 $n$ 很大时,$f_n(A)$ 会稳定在某个常数附近波动。这个常数就是事件 $A$ 的**概率**。 **定义 1.4(概率的统计定义)** 在大量重复试验中,事件 $A$ 发生的**频率的稳定值**称为 $A$ 的**概率**,记为 $P(A)$。 ==== 1.3.2 概率的公理化定义 ==== **定义 1.5(概率的公理化定义 - 柯尔莫哥洛夫)** 设 $\Omega$ 是样本空间,$\mathcal{F}$ 是 $\Omega$ 的某些子集组成的集合(事件域)。若实值函数 $P$ 满足: **公理 1(非负性):** 对任意 $A \in \mathcal{F}$,$P(A) \geq 0$ **公理 2(规范性):** $P(\Omega) = 1$ **公理 3(可列可加性):** 对任意两两互斥的事件 $A_1, A_2, \ldots$($A_i \cap A_j = \emptyset, i \neq j$),有 $$P\left(\bigcup_{i=1}^{\infty} A_i\right) = \sum_{i=1}^{\infty} P(A_i)$$ 则称 $P(A)$ 为事件 $A$ 的**概率**。 ==== 1.3.3 概率的基本性质 ==== **性质 1:** $P(\emptyset) = 0$ **证明:** 令 $A_i = \emptyset$($i = 1, 2, \ldots$),则 $\bigcup_{i=1}^{\infty} A_i = \emptyset$。 由可列可加性:$P(\emptyset) = \sum_{i=1}^{\infty} P(\emptyset)$,故 $P(\emptyset) = 0$。 **性质 2(有限可加性):** 若 $A_1, A_2, \ldots, A_n$ 两两互斥,则 $$P\left(\bigcup_{i=1}^n A_i\right) = \sum_{i=1}^n P(A_i)$$ **性质 3:** $P(\overline{A}) = 1 - P(A)$ **证明:** $A \cup \overline{A} = \Omega$,$A \cap \overline{A} = \emptyset$ 故 $P(A) + P(\overline{A}) = P(\Omega) = 1$ **性质 4(单调性):** 若 $A \subseteq B$,则 $P(A) \leq P(B)$ 且 $P(B - A) = P(B) - P(A)$ **性质 5(加法公式):** $$P(A \cup B) = P(A) + P(B) - P(AB)$$ **证明:** $A \cup B = A \cup (B - A)$,$A \cap (B - A) = \emptyset$ $$P(A \cup B) = P(A) + P(B - A) = P(A) + P(B - AB) = P(A) + P(B) - P(AB)$$ **推广(容斥原理):** $$P\left(\bigcup_{i=1}^n A_i\right) = \sum_{i=1}^n P(A_i) - \sum_{1 \leq i < j \leq n} P(A_i A_j) + \cdots + (-1)^{n-1} P(A_1 A_2 \cdots A_n)$$ **例 1.5** 已知 $P(A) = 0.4$,$P(B) = 0.5$,$P(AB) = 0.2$,求: (1) $P(A \cup B) = 0.4 + 0.5 - 0.2 = 0.7$ (2) $P(\overline{A}\overline{B}) = P(\overline{A \cup B}) = 1 - 0.7 = 0.3$ (3) $P(\overline{A} \cup \overline{B}) = P(\overline{AB}) = 1 - 0.2 = 0.8$ ===== 1.4 古典概型与几何概型 ===== ==== 1.4.1 古典概型 ==== **定义 1.6(古典概型)** 若试验满足: 1. 样本空间 $\Omega$ 只含有限个样本点:$\Omega = \{\omega_1, \omega_2, \ldots, \omega_n\}$ 2. 每个基本事件发生的可能性相同 则称该试验为**古典概型**(等可能概型)。 **古典概型的概率计算:** $$P(A) = \frac{A \text{ 包含的基本事件数}}{\Omega \text{ 中基本事件总数}} = \frac{k}{n}$$ **例 1.6** 掷一颗均匀的骰子,求下列事件的概率: (1) $A$:"出现偶数点" $P(A) = \frac{3}{6} = \frac{1}{2}$ (2) $B$:"出现点数大于 4" $P(B) = \frac{2}{6} = \frac{1}{3}$ **例 1.7** 从 0, 1, 2, ..., 9 中随机取 4 个数(不放回),求恰好组成一个 4 位偶数的概率。 **解:** 总取法:$A_{10}^4 = 10 \times 9 \times 8 \times 7 = 5040$ 偶数要求末位是 0, 2, 4, 6, 8。 - 末位是 0:首位有 9 种,共 $9 \times 8 \times 7 = 504$ - 末位是 2, 4, 6, 8(4种):首位不能为 0 和末位,共 $4 \times 8 \times 8 \times 7 = 1792$ $$P = \frac{504 + 1792}{5040} = \frac{2296}{5040} = \frac{41}{90}$$ **例 1.8(生日问题)** 假设一年有 365 天,求 $n$ 个人中至少有两人生日相同的概率。 **解:** 设 $A$ 为"至少两人生日相同",则 $\overline{A}$ 为"所有人生日都不同"。 $$P(\overline{A}) = \frac{365 \times 364 \times \cdots \times (365-n+1)}{365^n}$$ $$P(A) = 1 - \frac{365!}{(365-n)! \cdot 365^n}$$ 当 $n = 23$ 时,$P(A) \approx 0.507 > 0.5$ 当 $n = 50$ 时,$P(A) \approx 0.97$ ==== 1.4.2 几何概型 ==== **定义 1.7(几何概型)** 若试验满足: 1. 样本空间 $\Omega$ 是可度量的几何区域 2. 每个样本点落入 $\Omega$ 中某区域的可能性与该区域的度量成正比,与位置和形状无关 则事件 $A$ 的概率为: $$P(A) = \frac{\mu(A)}{\mu(\Omega)}$$ 其中 $\mu$ 表示度量(长度、面积、体积等)。 **例 1.9(会面问题)** 甲、乙两人约定在 0 到 $T$ 这段时间内在某地会面,先到者等待 $t$($t < T$)时间后离去。求两人能会面的概率。 **解:** 设甲、乙到达时刻分别为 $x, y \in [0, T]$。 样本空间:$\Omega = \{(x, y) : 0 \leq x \leq T, 0 \leq y \leq T\}$,面积 $\mu(\Omega) = T^2$ 能会面条件:$|x - y| \leq t$ 事件 $A = \{(x, y) : |x - y| \leq t\}$ $\overline{A} = \{(x, y) : y > x + t \text{ 或 } y < x - t\}$,面积为 $(T-t)^2$ $$P(A) = 1 - \frac{(T-t)^2}{T^2} = 1 - \left(1 - \frac{t}{T}\right)^2$$ ===== 1.5 条件概率 ===== ==== 1.5.1 条件概率的定义 ==== **定义 1.8(条件概率)** 设 $A, B$ 是两个事件,且 $P(A) > 0$,称 $$P(B|A) = \frac{P(AB)}{P(A)}$$ 为在事件 $A$ 发生的条件下事件 $B$ 发生的**条件概率**。 **例 1.10** 掷两颗骰子,已知点数之和为 7,求其中一颗为 1 点的概率。 **解:** 设 $A$:"点数之和为 7",$B$:"其中一颗为 1 点" $A = \{(1,6), (2,5), (3,4), (4,3), (5,2), (6,1)\}$,$P(A) = \frac{6}{36} = \frac{1}{6}$ $AB = \{(1,6), (6,1)\}$,$P(AB) = \frac{2}{36} = \frac{1}{18}$ $$P(B|A) = \frac{P(AB)}{P(A)} = \frac{1/18}{1/6} = \frac{1}{3}$$ ==== 1.5.2 乘法公式 ==== **定理 1.1(乘法公式)** 若 $P(A) > 0$,则 $P(AB) = P(A)P(B|A)$ 若 $P(A) > 0, P(AB) > 0$,则 $P(ABC) = P(A)P(B|A)P(C|AB)$ **推广:** $$P(A_1 A_2 \cdots A_n) = P(A_1)P(A_2|A_1)P(A_3|A_1 A_2) \cdots P(A_n|A_1 \cdots A_{n-1})$$ **例 1.11** 袋中有 5 白 3 黑共 8 个球,不放回地取两次,求两次都取到白球的概率。 **解:** 设 $A$:"第一次取白球",$B$:"第二次取白球" $$P(A) = \frac{5}{8}, \quad P(B|A) = \frac{4}{7}$$ $$P(AB) = \frac{5}{8} \times \frac{4}{7} = \frac{5}{14}$$ ===== 1.6 全概率公式与贝叶斯公式 ===== ==== 1.6.1 全概率公式 ==== **定理 1.2(全概率公式)** 设 $A_1, A_2, \ldots, A_n$ 是样本空间 $\Omega$ 的一个划分(完备事件组),$P(A_i) > 0$,则对任意事件 $B$: $$P(B) = \sum_{i=1}^n P(A_i)P(B|A_i)$$ **证明:** $B = B\Omega = B(A_1 \cup A_2 \cup \cdots \cup A_n) = BA_1 \cup BA_2 \cup \cdots \cup BA_n$ 由于 $A_i$ 两两互斥,$BA_i$ 也两两互斥,故 $$P(B) = \sum_{i=1}^n P(BA_i) = \sum_{i=1}^n P(A_i)P(B|A_i)$$ **例 1.12** 某工厂有甲、乙、丙三台机器生产产品,产量分别占总产量的 50%、30%、20%。已知各机器的次品率分别为 3%、4%、5%。 (1) 求任取一件产品是次品的概率。 (2) 若取到次品,求它来自甲机器的概率。 **解:** 设 $A_1, A_2, A_3$ 分别表示产品来自甲、乙、丙机器,$B$ 表示取到次品。 (1) 由全概率公式: $$\begin{aligned} P(B) &= P(A_1)P(B|A_1) + P(A_2)P(B|A_2) + P(A_3)P(B|A_3) \\ &= 0.5 \times 0.03 + 0.3 \times 0.04 + 0.2 \times 0.05 \\ &= 0.015 + 0.012 + 0.010 = 0.037 = 3.7\% \end{aligned}$$ (2) 由贝叶斯公式: $$P(A_1|B) = \frac{P(A_1)P(B|A_1)}{P(B)} = \frac{0.5 \times 0.03}{0.037} = \frac{0.015}{0.037} \approx 0.405 = 40.5\%$$ ==== 1.6.2 贝叶斯公式 ==== **定理 1.3(贝叶斯公式)** 设 $A_1, A_2, \ldots, A_n$ 是样本空间的一个划分,$P(A_i) > 0$,则 $$P(A_i|B) = \frac{P(A_i)P(B|A_i)}{\sum_{j=1}^n P(A_j)P(B|A_j)} = \frac{P(A_i)P(B|A_i)}{P(B)}$$ **贝叶斯公式的意义:** - $P(A_i)$:先验概率(试验前的概率) - $P(A_i|B)$:后验概率(获得信息 $B$ 后的修正概率) 贝叶斯公式是**由结果推原因**的概率计算方法。 **例 1.13(疾病检测)** 某疾病的发病率为 0.1%。检测方法的准确率:患者确实患病时检测呈阳性的概率为 99%;健康人检测呈阴性的概率为 98%。 若某人检测结果为阳性,求他实际患病的概率。 **解:** 设 $A$:"患病",$\overline{A}$:"健康",$B$:"检测阳性" $P(A) = 0.001$,$P(B|A) = 0.99$,$P(B|\overline{A}) = 0.02$ $$\begin{aligned} P(A|B) &= \frac{P(A)P(B|A)}{P(A)P(B|A) + P(\overline{A})P(B|\overline{A})} \\ &= \frac{0.001 \times 0.99}{0.001 \times 0.99 + 0.999 \times 0.02} \\ &= \frac{0.00099}{0.00099 + 0.01998} \approx 0.047 = 4.7\% \end{aligned}$$ 尽管检测准确率很高,但由于疾病发病率很低,检测阳性者实际患病的概率只有约 4.7%。 ===== 1.7 事件的独立性 ===== ==== 1.7.1 两个事件的独立性 ==== **定义 1.9(独立性)** 设 $A, B$ 是两个事件,若 $$P(AB) = P(A)P(B)$$ 则称事件 $A$ 与 $B$ **相互独立**,简称**独立**。 **定理 1.4** 若 $P(A) > 0$,则 $A$ 与 $B$ 独立当且仅当 $P(B|A) = P(B)$。 **独立性的性质:** - 若 $A$ 与 $B$ 独立,则 $A$ 与 $\overline{B}$、$\overline{A}$ 与 $B$、$\overline{A}$ 与 $\overline{B}$ 都独立 ==== 1.7.2 多个事件的独立性 ==== **定义 1.10(两两独立与相互独立)** 设 $A_1, A_2, \ldots, A_n$ 是 $n$ 个事件: - 若对任意 $1 \leq i < j \leq n$,有 $P(A_i A_j) = P(A_i)P(A_j)$,则称它们**两两独立** - 若对任意 $k$($2 \leq k \leq n$)和任意 $1 \leq i_1 < i_2 < \cdots < i_k \leq n$,有 $P(A_{i_1}A_{i_2}\cdots A_{i_k}) = P(A_{i_1})P(A_{i_2})\cdots P(A_{i_k})$,则称它们**相互独立** **注:** 相互独立 ⇒ 两两独立,但反之不成立。 **例 1.14** 设样本空间 $\Omega = \{1, 2, 3, 4\}$,每个样本点等概率。 $A = \{1, 2\}$,$B = \{1, 3\}$,$C = \{1, 4\}$ $P(A) = P(B) = P(C) = \frac{1}{2}$ $P(AB) = P(\{1\}) = \frac{1}{4} = P(A)P(B)$,同理 $AC, BC$ 也独立。 但 $P(ABC) = P(\{1\}) = \frac{1}{4} \neq \frac{1}{8} = P(A)P(B)P(C)$ 故 $A, B, C$ 两两独立但不相互独立。 ===== 1.8 典型例题 ===== **例题 1.1** 证明:$P(A \cup B \cup C) = P(A) + P(B) + P(C) - P(AB) - P(AC) - P(BC) + P(ABC)$ **证明:** $P(A \cup B \cup C) = P((A \cup B) \cup C) = P(A \cup B) + P(C) - P((A \cup B)C)$ $= P(A) + P(B) - P(AB) + P(C) - P(AC \cup BC)$ $= P(A) + P(B) + P(C) - P(AB) - P(AC) - P(BC) + P(ABC)$ **例题 1.2** 袋中有 $a$ 个白球,$b$ 个黑球。不放回地取 $k$ 个球($k \leq a + b$),求第 $k$ 次取到白球的概率。 **解:** 由对称性,第 $k$ 次取到白球的概率与第一次相同,为 $\frac{a}{a+b}$。 严格证明:用全概率公式对前 $k-1$ 次取球结果求和,结果仍为 $\frac{a}{a+b}$。 ===== 1.9 习题 ===== **基础题** 1. 设 $A, B, C$ 是三个事件,用 $A, B, C$ 的运算表示: (a) $A$ 发生,$B, C$ 不发生 (b) $A, B, C$ 至少有一个发生 (c) $A, B, C$ 恰有一个发生 2. 已知 $P(A) = 0.6$,$P(B) = 0.5$,$P(A \cup B) = 0.8$,求: (a) $P(AB)$ (b) $P(\overline{A}\overline{B})$ (c) $P(\overline{A} \cup B)$ **提高题** 3. 袋中有 10 个球,其中 4 白 6 黑。不放回地取 3 个球,求: (a) 恰好 2 白 1 黑的概率 (b) 至少 1 个白球的概率 4. 某射手的命中率为 0.8,独立射击 3 次,求: (a) 恰好命中 2 次的概率 (b) 至少命中 1 次的概率 **挑战题** 5. 证明:若 $P(A) > 0$,$P(B) > 0$,且 $A$ 与 $B$ 独立,则 $A$ 与 $B$ 相容(即 $AB \neq \emptyset$)。 6. (蒙特霍尔问题)游戏节目有三扇门,背后分别是两羊一车。你选一扇门后,主持人(知道门后情况)打开另一扇有羊的门,问你是否换门。证明换门后获胜概率为 $\frac{2}{3}$。