====== 第七章 条件期望与鞅 ====== ===== 7.1 引言 ===== 鞅论是现代概率论的核心分支之一,由Doob等人在20世纪中叶系统发展起来。鞅描述了"公平游戏"的数学模型,在金融学(有效市场假说)、统计学(序贯分析)、随机过程等领域有广泛应用。 **鞅的核心思想**:给定当前信息,未来期望等于当前值。这与Markov性(未来只依赖于现在)不同,鞅关注的是期望值的条件特征。 ===== 7.2 条件期望 ===== ==== 7.2.1 关于$\sigma$-代数的条件期望 ==== **定义7.1(条件期望)** 设 $(\Omega, \mathcal{F}, P)$ 是概率空间,$\mathcal{G} \subseteq \mathcal{F}$ 是子$\sigma$-代数,$X$ 是可积随机变量。$X$ 关于 $\mathcal{G}$ 的**条件期望**是满足以下条件的随机变量 $E[X|\mathcal{G}]$: * $E[X|\mathcal{G}]$ 是 $\mathcal{G}$-可测的 * 对任意 $A \in \mathcal{G}$,$\int_A E[X|\mathcal{G}]dP = \int_A X dP$ **存在唯一性**:由Radon-Nikodym定理保证存在性和在a.s.意义下的唯一性。 ==== 7.2.2 条件期望的性质 ==== **定理7.1(基本性质)** (1) **线性性**:$E[aX + bY|\mathcal{G}] = aE[X|\mathcal{G}] + bE[Y|\mathcal{G}]$ (2) **单调性**:若 $X \leq Y$ a.s.,则 $E[X|\mathcal{G}] \leq E[Y|\mathcal{G}]$ a.s. (3) **塔性质**(Tower Property):若 $\mathcal{G}_1 \subseteq \mathcal{G}_2$,则 $$E[E[X|\mathcal{G}_2]|\mathcal{G}_1] = E[X|\mathcal{G}_1]$$ 特别地,$E[E[X|\mathcal{G}]] = E[X]$。 (4) **取性质**:若 $X$ 是 $\mathcal{G}$-可测的,则 $E[XY|\mathcal{G}] = X E[Y|\mathcal{G}]$ (5) **独立性**:若 $X$ 与 $\mathcal{G}$ 独立,则 $E[X|\mathcal{G}] = E[X]$ (6) **Jensen不等式**:若 $\varphi$ 是凸函数,则 $\varphi(E[X|\mathcal{G}]) \leq E[\varphi(X)|\mathcal{G}]$ ==== 7.2.3 条件期望的收敛定理 ==== **定理7.2(条件单调收敛定理)** 若 $0 \leq X_n \uparrow X$ a.s.,则 $E[X_n|\mathcal{G}] \uparrow E[X|\mathcal{G}]$ a.s. **定理7.3(条件Fatou引理)** 若 $X_n \geq 0$,则 $E[\liminf X_n|\mathcal{G}] \leq \liminf E[X_n|\mathcal{G}]$ **定理7.4(条件控制收敛定理)** 若 $|X_n| \leq Y$,$Y$ 可积,$X_n \to X$ a.s.,则 $E[X_n|\mathcal{G}] \to E[X|\mathcal{G}]$ a.s. ==== 7.2.4 关于随机变量的条件期望 ==== **定义7.2** $E[X|Y] = E[X|\sigma(Y)]$,其中 $\sigma(Y)$ 是 $Y$ 生成的$\sigma$-代数。 $E[X|Y]$ 是 $Y$ 的Borel可测函数,可写为 $g(Y)$。 ===== 7.3 鞅的定义与基本性质 ===== ==== 7.3.1 滤子与适应过程 ==== **定义7.3(滤子)** 概率空间 $(\Omega, \mathcal{F}, P)$ 上的**滤子**(Filtration)是单调递增的$\sigma$-代数序列 $\{\mathcal{F}_n, n \geq 0\}$: $$\mathcal{F}_0 \subseteq \mathcal{F}_1 \subseteq \mathcal{F}_2 \subseteq \cdots \subseteq \mathcal{F}$$ **解释**:$\mathcal{F}_n$ 表示到时刻 $n$ 为止可获得的全部信息。 **定义7.4(适应过程)** 随机序列 $\{X_n\}$ 称为**适应**于滤子 $\{\mathcal{F}_n\}$,如果对每个 $n$,$X_n$ 是 $\mathcal{F}_n$-可测的。 ==== 7.3.2 鞅的定义 ==== **定义7.5(鞅)** 适应序列 $\{X_n, \mathcal{F}_n, n \geq 0\}$ 称为**鞅**,如果: * $E[|X_n|] < \infty$ 对所有 $n$ * $E[X_{n+1}|\mathcal{F}_n] = X_n$ a.s. 对所有 $n$ **定义7.6(下鞅/上鞅)** * **下鞅**(Submartingale):$E[X_{n+1}|\mathcal{F}_n] \geq X_n$(期望上升) * **上鞅**(Supermartingale):$E[X_{n+1}|\mathcal{F}_n] \leq X_n$(期望下降) **直观理解**:鞅 = 公平游戏,下鞅 = 有利游戏,上鞅 = 不利游戏。 ==== 7.3.3 基本性质 ==== **定理7.5** (1) $\{X_n\}$ 是鞅 $\Rightarrow$ $E[X_n] = E[X_0]$ 对所有 $n$ (2) $\{X_n\}$ 是下鞅 $\Rightarrow$ $E[X_n] \geq E[X_0]$,且单调递增 (3) $\{X_n\}$ 是鞅,$\varphi$ 是凸函数,则 $\{\varphi(X_n)\}$ 是下鞅(若可积) (4) $\{X_n\}$ 是鞅,则 $\{|X_n|\}$ 和 $\{X_n^2\}$(若可积)是下鞅 ===== 7.4 鞅的例子 ===== ==== 7.4.1 随机游动 ===== **例7.1** 设 $\{\xi_n\}$ 独立,$E[\xi_n] = 0$,$X_n = \sum_{k=1}^n \xi_k$。则 $\{X_n\}$ 是鞅。 **证明**:$E[X_{n+1}|\mathcal{F}_n] = E[X_n + \xi_{n+1}|\mathcal{F}_n] = X_n + E[\xi_{n+1}] = X_n$。 ==== 7.4.2 Wald鞅 ==== **例7.2** 设 $\{\xi_n\}$ 独立同分布,矩母函数 $\phi(t) = E[e^{t\xi_1}]$ 存在。定义: $$M_n = \frac{e^{tS_n}}{\phi(t)^n}, \quad S_n = \sum_{k=1}^n \xi_k$$ 则 $\{M_n\}$ 是鞅。 ==== 7.4.3 条件期望鞅 ==== **例7.3** 设 $X$ 可积,$\{\mathcal{F}_n\}$ 是滤子,定义 $X_n = E[X|\mathcal{F}_n]$。则 $\{X_n\}$ 是鞅。 **证明**:$E[X_{n+1}|\mathcal{F}_n] = E[E[X|\mathcal{F}_{n+1}]|\mathcal{F}_n] = E[X|\mathcal{F}_n] = X_n$。 ==== 7.4.4 金融中的应用:贴现股价 ==== **例7.4(Black-Scholes框架)** 在风险中性测度下,贴现股价过程是鞅: $$M_n = e^{-rn}S_n$$ 其中 $r$ 是无风险利率,$S_n$ 是股价。 ===== 7.5 停时与可选停时定理 ===== ==== 7.5.1 停时的定义 ==== **定义7.7(停时)** 取值于 $\{0, 1, 2, \ldots, +\infty\}$ 的随机变量 $\tau$ 称为关于滤子 $\{\mathcal{F}_n\}$ 的**停时**,如果对每个 $n$,事件 $\{\tau \leq n\} \in \mathcal{F}_n$。 **等价条件**:$\{\tau = n\} \in \mathcal{F}_n$ 对每个 $n$。 **直观**:停时的决策"是否现在停止"只依赖于当前和过去的信息,不依赖于未来。 **例7.5** * 首达时:$\tau_a = \inf\{n \geq 0: X_n = a\}$ * 退出时:$\tau = \inf\{n \geq 0: X_n \notin (a, b)\}$ ==== 7.5.2 可选停时定理(Optional Stopping Theorem)==== **定理7.6(Doob可选停时定理)** 设 $\{X_n\}$ 是鞅,$\tau$ 是停时。在一定条件下: $$E[X_\tau] = E[X_0]$$ **定理7.7** 可选停时定理成立的条件(满足其一即可): (1) $\tau$ 有界(存在 $N$ 使 $\tau \leq N$ a.s.) (2) $E[\tau] < \infty$ 且 $|X_{n+1} - X_n| \leq C$(有界增量) (3) $|X_{n \wedge \tau}| \leq Y$ 对某个可积随机变量 $Y$ ==== 7.5.3 应用:赌徒输光问题 ===== **例7.6** 简单随机游动,$p = q = 1/2$,$X_0 = i$,$0 < i < N$。求被0吸收的概率。 设 $\tau = \inf\{n: X_n = 0 \text{ 或 } N\}$。由可选停时定理: $$E[X_\tau] = E[X_0] = i$$ 又 $E[X_\tau] = 0 \cdot P(X_\tau = 0) + N \cdot P(X_\tau = N)$,故: $$P(X_\tau = N) = \frac{i}{N}, \quad P(X_\tau = 0) = \frac{N-i}{N}$$ ===== 7.6 鞅变换与Doob分解 ===== ==== 7.6.1 可料序列 ==== **定义7.8(可料序列)** 序列 $\{H_n\}$ 称为**可料**的,如果 $H_n$ 是 $\mathcal{F}_{n-1}$-可测的($H_0$ 为常数)。 ==== 7.6.2 鞅变换 ==== **定义7.9(鞅变换)** 设 $\{X_n\}$ 是鞅,$\{H_n\}$ 可料且有界,定义: $$(H \cdot X)_n = \sum_{k=1}^n H_k(X_k - X_{k-1})$$ 称为**鞅变换**或**离散随机积分**。 **定理7.8** $\{(H \cdot X)_n\}$ 是鞅。 **金融解释**:$X_n$ 是股价,$H_n$ 是基于前 $n-1$ 期信息的持仓量,$(H \cdot X)_n$ 是累积收益。鞅变换表示"无法战胜市场"。 ===== 7.7 连续时间鞅 ===== **定义7.10(连续时间鞅)** 适应过程 $\{X(t), \mathcal{F}_t, t \geq 0\}$ 称为**鞅**,如果: * $E[|X(t)|] < \infty$ 对所有 $t$ * $E[X(t)|\mathcal{F}_s] = X(s)$ a.s. 对 $s < t$ **例7.7(布朗运动)** 标准布朗运动 $\{B(t)\}$ 是鞅。 **证明**:$E[B(t)|\mathcal{F}_s] = E[B(s) + (B(t) - B(s))|\mathcal{F}_s] = B(s) + 0 = B(s)$。 **例7.8** $B(t)^2 - t$ 是鞅。 ===== 7.8 本章例题详解 ===== **例题1** 证明:若 $\{X_n\}$ 是下鞅,则存在唯一的分解 $X_n = M_n + A_n$,其中 $\{M_n\}$ 是鞅,$\{A_n\}$ 是可料递增过程,$A_0 = 0$。 **证明(Doob分解)**:令 $A_0 = 0$,$A_{n+1} = A_n + E[X_{n+1} - X_n|\mathcal{F}_n]$,$M_n = X_n - A_n$。 验证:$M_n$ 是鞅,$A_n$ 可料递增。 **例题2** 利用Wald鞅求简单随机游动首达时的分布。 **解**:设 $\phi(t) = pe^t + qe^{-t}$,$M_n = e^{tS_n}/\phi(t)^n$ 是鞅。 对首达时 $\tau$ 应用可选停时(需验证条件),得: $$E\left[\frac{e^{tS_\tau}}{\phi(t)^\tau}\right] = 1$$ 由此可导出 $\tau$ 的生成函数。 ===== 7.9 本章习题 ===== **习题7.1** 证明条件期望的性质:(1) 塔性质 (2) 取性质。 **习题7.2** 设 $\{X_n\}$ 是鞅,证明 $E[X_n|\mathcal{F}_m] = X_m$ 对 $m < n$。 **习题7.3** 设 $\xi_n$ 独立,$P(\xi_n = 1) = P(\xi_n = -1) = 1/2$,$X_n = \prod_{k=1}^n \xi_k$。证明 $\{X_n\}$ 是鞅。 **习题7.4** 简单对称随机游动,$X_0 = 0$。求 $E[\tau]$,其中 $\tau = \inf\{n: X_n = 1\}$。 **习题7.5** 设 $\{X_n\}$ 是下鞅,$\varphi$ 是增凸函数。证明 $\{\varphi(X_n)\}$ 是下鞅(若可积)。 **习题7.6** 证明:连续时间过程 $X(t)$ 是鞅当且仅当对所有停时 $\tau$,$E[X(t \wedge \tau)] = E[X(0)]$。 **习题7.7** 设 $B(t)$ 是标准布朗运动,$M(t) = \exp(\theta B(t) - \theta^2 t/2)$。证明 $\{M(t)\}$ 是鞅。 **习题7.8** 设 $\tau$ 是停时,证明 $\tau \wedge n$ 也是停时,且对鞅 $\{X_n\}$,$E[X_{\tau \wedge n}] = E[X_0]$。 ---- **上一章**:[[第六章_连续时间马尔可夫链]] | **下一章**:[[第八章_鞅的收敛定理]]