泊松过程是最基本也是最重要的计数过程之一,它描述了一类随机事件随时间发生的过程。典型应用包括:服务系统中顾客的到达、电话交换台的呼叫、放射性物质的衰变、网络数据包的到达、交通事故的发生等。
泊松过程的特点:
定义2.1(计数过程) 随机过程 $\{N(t), t \geq 0\}$ 称为计数过程,如果 $N(t)$ 表示到时刻 $t$ 为止某类事件发生的次数,满足:
定义2.2(泊松过程,定义一) 计数过程 $\{N(t), t \geq 0\}$ 称为参数为 $\lambda$($\lambda > 0$)的泊松过程,如果满足:
条件(iv)称为稀有性条件,表示在很短的时间内,事件发生概率很小,且多个事件同时发生的概率可以忽略。
定义2.3(泊松过程,定义二) 计数过程 $\{N(t), t \geq 0\}$ 称为参数为 $\lambda$ 的泊松过程,如果满足:
$$P(N(t) = k) = \frac{(\lambda t)^k}{k!}e^{-\lambda t}, \quad k = 0, 1, 2, \ldots$$
定理2.1(两种定义的等价性) 定义2.2和定义2.3是等价的。
证明概要:
(定义2.2 $\Rightarrow$ 定义2.3):设 $P_n(t) = P(N(t) = n)$。对于充分小的 $h > 0$:
$$\begin{aligned}
P_0(t+h) &= P(N(t+h) = 0) = P(N(t) = 0, N(t+h) - N(t) = 0)
&= P_0(t) \cdot P(N(t+h) - N(t) = 0) = P_0(t)[1 - \lambda h + o(h)]
\end{aligned}$$
因此: $$\frac{P_0(t+h) - P_0(t)}{h} = -\lambda P_0(t) + \frac{o(h)}{h}$$
令 $h \to 0$,得微分方程: $$P_0'(t) = -\lambda P_0(t), \quad P_0(0) = 1$$
解得:$P_0(t) = e^{-\lambda t}$。
类似地,对 $n \geq 1$: $$P_n(t+h) = P_n(t)(1-\lambda h) + P_{n-1}(t)\lambda h + o(h)$$
得到递推微分方程: $$P_n'(t) = -\lambda P_n(t) + \lambda P_{n-1}(t)$$
利用归纳法可证 $P_n(t) = \frac{(\lambda t)^n}{n!}e^{-\lambda t}$。
设 $\{N(t), t \geq 0\}$ 是参数为 $\lambda$ 的泊松过程:
均值函数: $$E[N(t)] = \lambda t$$
方差函数: $$Var(N(t)) = \lambda t$$
协方差函数:对于 $s \leq t$, $$Cov(N(s), N(t)) = Var(N(s)) = \lambda s$$
一般地: $$Cov(N(s), N(t)) = \lambda \min(s, t)$$
定理2.2 设 $\{N_1(t)\}$ 和 $\{N_2(t)\}$ 是独立的泊松过程,参数分别为 $\lambda_1$ 和 $\lambda_2$,则 $\{N_1(t) + N_2(t)\}$ 是参数为 $\lambda_1 + \lambda_2$ 的泊松过程。
证明:独立泊松随机变量之和仍服从泊松分布,参数为两者之和。
定理2.3 设 $\{N(t)\}$ 是参数为 $\lambda$ 的泊松过程,每个事件以概率 $p$ 被标记为类型I,以概率 $1-p$ 被标记为类型II,且标记相互独立。设 $N_1(t)$ 和 $N_2(t)$ 分别表示到时刻 $t$ 类型I和类型II事件发生的次数,则:
证明:对给定的 $N(t) = n$,$N_1(t) \sim B(n, p)$。因此:
$$\begin{aligned}
P(N_1(t) = k, N_2(t) = m) &= P(N_1(t) = k, N_2(t) = m | N(t) = k+m)P(N(t) = k+m)
&= \binom{k+m}{k}p^k(1-p)^m \cdot \frac{(\lambda t)^{k+m}}{(k+m)!}e^{-\lambda t}
&= \frac{(\lambda p t)^k}{k!}e^{-\lambda pt} \cdot \frac{(\lambda(1-p)t)^m}{m!}e^{-\lambda(1-p)t}
\end{aligned}$$
这证明了独立性和泊松性。
设 $S_0 = 0$,$S_n$ 表示第 $n$ 个事件发生的时刻($n \geq 1$)。定义到达时间间隔: $$T_n = S_n - S_{n-1}, \quad n = 1, 2, \ldots$$
定理2.4 泊松过程的到达时间间隔 $\{T_n, n \geq 1\}$ 是独立同分布的随机变量,服从参数为 $\lambda$ 的指数分布,即 $T_n \sim Exp(\lambda)$。
证明:
首先求 $T_1$ 的分布: $$P(T_1 > t) = P(N(t) = 0) = e^{-\lambda t}$$
所以 $T_1 \sim Exp(\lambda)$。
对于 $T_2$:
$$\begin{aligned}
P(T_2 > t | T_1 = s) &= P(N(s+t) - N(s) = 0 | T_1 = s)
&= P(N(s+t) - N(s) = 0) = e^{-\lambda t}
\end{aligned}$$
由平稳增量性,这与 $s$ 无关,故 $T_2 \sim Exp(\lambda)$ 且与 $T_1$ 独立。
由归纳法可证结论。
定理2.5 第 $n$ 个事件的等待时间 $S_n = T_1 + T_2 + \cdots + T_n$ 服从参数为 $n$ 和 $\lambda$ 的伽马分布(Gamma分布),即 $S_n \sim \Gamma(n, \lambda)$,密度函数为: $$f_{S_n}(t) = \frac{\lambda^n t^{n-1}}{(n-1)!}e^{-\lambda t}, \quad t \geq 0$$
证明:由于 $T_1, \ldots, T_n$ 独立同分布于 $Exp(\lambda)$,其和服从伽马分布。
也可直接证明: $$P(S_n \leq t) = P(N(t) \geq n) = \sum_{k=n}^{\infty} \frac{(\lambda t)^k}{k!}e^{-\lambda t}$$
求导得密度函数。
例2.1 设顾客按照泊松过程到达商店,速率 $\lambda = 4$(人/小时)。
(1) 求两位顾客到达的时间间隔小于10分钟的概率 (2) 求第5位顾客在1小时内到达的概率
解:
(1) $T \sim Exp(4)$,10分钟 = 1/6小时: $$P(T < \frac{1}{6}) = 1 - e^{-4/6} = 1 - e^{-2/3} \approx 0.487$$
(2) $S_5 \sim \Gamma(5, 4)$: $$P(S_5 \leq 1) = P(N(1) \geq 5) = 1 - \sum_{k=0}^{4} \frac{4^k}{k!}e^{-4} \approx 0.371$$
定理2.6 设 $\{N(t), t \geq 0\}$ 是计数过程,$T_n$ 为到达时间间隔,则以下陈述等价:
定理2.7 设 $\{N(t)\}$ 是泊松过程,给定 $N(t) = n$ 时,到达时刻 $(S_1, S_2, \ldots, S_n)$ 的联合密度为: $$f(s_1, s_2, \ldots, s_n | N(t) = n) = \frac{n!}{t^n}, \quad 0 < s_1 < s_2 < \cdots < s_n < t$$
这正是 $n$ 个独立 $U[0, t]$ 随机变量的次序统计量的密度。
例2.2 设乘客按照泊松过程到达火车站,速率 $\lambda$。火车在时刻 $t$ 开出。求所有乘客等待时间之和的期望。
解:设第 $i$ 个乘客到达时刻为 $S_i$,等待时间为 $t - S_i$。总等待时间为: $$W = \sum_{i=1}^{N(t)} (t - S_i)$$
求条件期望:
$$\begin{aligned}
E[W | N(t) = n] &= E\left[\sum_{i=1}^{n} (t - S_i) | N(t) = n\right]
&= nt - E\left[\sum_{i=1}^{n} S_i | N(t) = n\right]
&= nt - n \cdot \frac{t}{2} = \frac{nt}{2}
\end{aligned}$$
其中利用了给定 $N(t) = n$ 时,$S_i$ 的期望为 $\frac{it}{n+1}$,故 $\sum E[S_i] = \frac{nt}{2}$。
因此: $$E[W] = E[E[W|N(t)]] = E\left[\frac{N(t)t}{2}\right] = \frac{\lambda t^2}{2}$$
定义2.4(复合泊松过程) 设 $\{N(t), t \geq 0\}$ 是参数为 $\lambda$ 的泊松过程,$\{Y_n, n \geq 1\}$ 是独立同分布的随机变量序列,且与 $\{N(t)\}$ 独立。定义: $$X(t) = \sum_{n=1}^{N(t)} Y_n, \quad t \geq 0$$ (当 $N(t) = 0$ 时,$X(t) = 0$)
则称 $\{X(t), t \geq 0\}$ 为复合泊松过程。
例2.3(保险公司理赔) 设 $N(t)$ 为到时刻 $t$ 的理赔次数,$Y_n$ 为第 $n$ 次理赔金额,则 $X(t)$ 为到时刻 $t$ 的总理赔金额。
例2.4(商店收入) 设顾客按泊松过程到达,每位顾客消费金额为 $Y_n$,则 $X(t)$ 为到时刻 $t$ 的总收入。
设 $E[Y_1] = \mu$,$Var(Y_1) = \sigma^2$。
均值: $$E[X(t)] = E[N(t)] \cdot E[Y_1] = \lambda t \mu$$
方差(利用条件方差公式):
$$\begin{aligned}
Var(X(t)) &= E[Var(X(t)|N(t))] + Var(E[X(t)|N(t)])
&= E[N(t)\sigma^2] + Var(N(t)\mu)
&= \lambda t \sigma^2 + \lambda t \mu^2 = \lambda t (\sigma^2 + \mu^2)
\end{aligned}$$
矩母函数: $$\phi_{X(t)}(u) = E[e^{uX(t)}] = \exp(\lambda t(\phi_Y(u) - 1))$$
其中 $\phi_Y(u) = E[e^{uY_1}]$ 是 $Y_1$ 的矩母函数。
例2.5 在保险理赔例子中,设 $\lambda = 5$(次/天),$Y_n \sim Exp(1/1000)$(均值1000元)。求30天内总理赔金额的均值和方差。
解:$\mu = 1000$,$\sigma^2 = 1000^2 = 10^6$
$$E[X(30)] = 5 \times 30 \times 1000 = 150000 \text{(元)}$$ $$Var(X(30)) = 5 \times 30 \times (10^6 + 10^6) = 3 \times 10^8$$ 标准差约为 $17321$ 元。
定义2.5 计数过程 $\{N(t), t \geq 0\}$ 称为强度函数为 $\lambda(t)$ 的非齐次泊松过程,如果:
此时 $N(t+s) - N(t) \sim Poisson(\int_t^{t+s} \lambda(u)du)$。
定义2.6 设 $\Lambda$ 是正的随机变量,给定 $\Lambda = \lambda$ 时,$\{N(t)\}$ 是参数为 $\lambda$ 的泊松过程,则称 $\{N(t)\}$ 为条件泊松过程。
例题1 证明:对泊松过程,当 $s < t$ 时,$E[N(s)|N(t)] = \frac{s}{t}N(t)$。
证明:由条件分布的性质,给定 $N(t) = n$ 时,$N(s)$ 服从二项分布 $B(n, s/t)$。因此: $$E[N(s)|N(t) = n] = n \cdot \frac{s}{t}$$ 即 $E[N(s)|N(t)] = \frac{s}{t}N(t)$。
例题2 设 $\{N(t)\}$ 是泊松过程,$S_n$ 是第 $n$ 个到达时刻。求 $E[S_4 | N(1) = 2]$。
解:给定 $N(1) = 2$ 时,前两个到达时刻 $S_1, S_2$ 是 $[0,1]$ 上两个独立均匀分布的次序统计量。设 $U_{(1)}, U_{(2)}$ 为其次序统计量,则: $$E[S_1 | N(1) = 2] = E[U_{(1)}] = \frac{1}{3}$$ $$E[S_2 | N(1) = 2] = E[U_{(2)}] = \frac{2}{3}$$
对于 $S_3, S_4$,利用无记忆性,从时刻1重新开始: $$S_3 = 1 + T_3, \quad S_4 = 1 + T_3 + T_4$$
其中 $T_3, T_4 \sim Exp(\lambda)$ 独立。因此:
$$\begin{aligned}
E[S_4 | N(1) = 2] &= E[S_2 | N(1) = 2] + E[T_3] + E[T_4]
&= \frac{2}{3} + \frac{1}{\lambda} + \frac{1}{\lambda} = \frac{2}{3} + \frac{2}{\lambda}
\end{aligned}$$
例题3 设 $\{N_1(t)\}$ 和 $\{N_2(t)\}$ 是独立泊松过程,参数分别为 $\lambda_1$ 和 $\lambda_2$。求 $N_1(t)$ 的第一个事件发生在 $N_2(t)$ 的第一个事件之前的概率。
解:设 $T_1, T_2$ 分别是两个过程的第一个到达时间间隔,则 $T_1 \sim Exp(\lambda_1)$,$T_2 \sim Exp(\lambda_2)$,独立。
$$P(T_1 < T_2) = \int_0^{\infty} P(T_2 > t) \lambda_1 e^{-\lambda_1 t} dt = \int_0^{\infty} e^{-\lambda_2 t} \lambda_1 e^{-\lambda_1 t} dt = \frac{\lambda_1}{\lambda_1 + \lambda_2}$$
习题2.1 设 $\{N(t), t \geq 0\}$ 是参数 $\lambda = 3$ 的泊松过程。
(1) 求 $P(N(1) = 2, N(3) = 5)$ (2) 求 $P(N(1) = 2 | N(3) = 5)$ (3) 求 $Cov(N(1), N(3))$
习题2.2 设 $\{N(t)\}$ 是泊松过程,证明:对 $s < t$,给定 $N(t) = n$ 时,$N(s)$ 的条件分布为二项分布 $B(n, s/t)$。
习题2.3 顾客按泊松过程到达商店,速率 $\lambda = 6$ 人/小时。商店9:00开门。
(1) 求到9:30恰好有2位顾客的概率 (2) 求到9:30至少有1位顾客的概率 (3) 已知到9:30有2位顾客,求到10:00有4位顾客的概率
习题2.4 设 $\{N(t)\}$ 是泊松过程,$S_n$ 是第 $n$ 个到达时刻。
(1) 求 $(S_1, S_2)$ 的联合分布 (2) 求 $E[S_n \cdot S_m]$ 对 $n \leq m$
习题2.5 保险公司理赔按泊松过程到达,速率 $\lambda = 10$ 次/月。每次理赔金额 $Y \sim Exp(1/5000)$。
(1) 求月平均理赔金额 (2) 求月理赔金额的方差 (3) 求月理赔金额超过60000元的概率(用正态近似)
习题2.6 设 $\{N(t)\}$ 是泊松过程,定义 $X(t) = N(t+1) - N(t)$。证明 $\{X(t), t \geq 0\}$ 是严平稳过程。
习题2.7 某路口东西向和南北向车辆分别按泊松过程到达,速率分别为 $\lambda_1 = 2$ 辆/分钟和 $\lambda_2 = 3$ 辆/分钟,相互独立。
(1) 求第一辆车是东西向的概率 (2) 求在5分钟内至少有10辆车到达的概率
习题2.8 设 $\{N(t)\}$ 是非齐次泊松过程,强度函数 $\lambda(t) = 2t$。求:
(1) $N(2) - N(1)$ 的分布 (2) $E[N(t)]$ 和 $Var(N(t))$
上一章:第一章_随机过程的基本概念 | 下一章:第三章_更新过程