====== 第三章 多维随机变量 ====== ===== 3.1 二维随机变量及其分布 ===== ==== 3.1.1 二维随机变量的概念 ==== **定义 3.1(二维随机变量)** 设 $E$ 是随机试验,样本空间为 $\Omega$,$X = X(\omega)$ 和 $Y = Y(\omega)$ 是定义在 $\Omega$ 上的随机变量,则由它们构成的向量 $(X, Y)$ 称为**二维随机变量**或**二维随机向量**。 **意义:** 很多随机现象需要两个或多个随机变量来描述。 - 炮弹落点:$(X, Y)$ 表示横纵坐标 - 人体测量:$(X, Y)$ 表示身高和体重 ==== 3.1.2 联合分布函数 ==== **定义 3.2(联合分布函数)** 设 $(X, Y)$ 是二维随机变量,对任意实数 $x, y$,二元函数 $$F(x, y) = P(X \leq x, Y \leq y)$$ 称为 $(X, Y)$ 的**联合分布函数**。 **几何意义:** $F(x, y)$ 表示随机点 $(X, Y)$ 落在以 $(x, y)$ 为顶点的左下方无穷矩形内的概率。 **性质:** 1. $0 \leq F(x, y) \leq 1$ 2. $F(x, y)$ 关于 $x$ 和 $y$ 都是单调不减的 3. $F(x, y)$ 关于 $x$ 和 $y$ 都是右连续的 4. $F(-\infty, y) = F(x, -\infty) = 0$,$F(+\infty, +\infty) = 1$ 5. 对任意 $x_1 < x_2$,$y_1 < y_2$: $$P(x_1 < X \leq x_2, y_1 < Y \leq y_2) = F(x_2, y_2) - F(x_2, y_1) - F(x_1, y_2) + F(x_1, y_1)$$ ===== 3.2 二维离散型随机变量 ===== ==== 3.2.1 联合分布律 ==== **定义 3.3(联合分布律)** 若二维随机变量 $(X, Y)$ 的所有可能取值为有限对或可列无限对 $(x_i, y_j)$,则称 $(X, Y)$ 为**二维离散型随机变量**。 记 $P(X = x_i, Y = y_j) = p_{ij}$($i, j = 1, 2, \ldots$),称为 $(X, Y)$ 的**联合分布律**。 **性质:** 1. $p_{ij} \geq 0$ 2. $\sum_{i=1}^{\infty}\sum_{j=1}^{\infty} p_{ij} = 1$ 常用表格表示: | $X \backslash Y$ | $y_1$ | $y_2$ | $\cdots$ | $y_j$ | $\cdots$ | |------------------|-------|-------|----------|-------|----------| | $x_1$ | $p_{11}$ | $p_{12}$ | $\cdots$ | $p_{1j}$ | $\cdots$ | | $x_2$ | $p_{21}$ | $p_{22}$ | $\cdots$ | $p_{2j}$ | $\cdots$ | | $\vdots$ | $\vdots$ | $\vdots$ | $\ddots$ | $\vdots$ | | | $x_i$ | $p_{i1}$ | $p_{i2}$ | $\cdots$ | $p_{ij}$ | $\cdots$ | **例 3.1** 袋中有 2 白 3 黑球,取两次,$X$ 表示第一次取到白球数(0 或 1),$Y$ 表示第二次取到白球数。分别就(1)有放回(2)无放回求联合分布律。 **解:** (1)有放回: | $X \backslash Y$ | 0 | 1 | |------------------|---|---| | 0 | $\frac{9}{25}$ | $\frac{6}{25}$ | | 1 | $\frac{6}{25}$ | $\frac{4}{25}$ | (2)无放回: | $X \backslash Y$ | 0 | 1 | |------------------|---|---| | 0 | $\frac{6}{20}$ | $\frac{6}{20}$ | | 1 | $\frac{6}{20}$ | $\frac{2}{20}$ | ==== 3.2.2 边缘分布律 ==== **定义 3.4(边缘分布律)** 设 $(X, Y)$ 的联合分布律为 $p_{ij}$,则 $X$ 的边缘分布律:$P(X = x_i) = \sum_{j=1}^{\infty} p_{ij} = p_{i\cdot}$ $Y$ 的边缘分布律:$P(Y = y_j) = \sum_{i=1}^{\infty} p_{ij} = p_{\cdot j}$ **例 3.2** 接上例,求边缘分布律。 **解:** (有放回情形) $P(X = 0) = \frac{9}{25} + \frac{6}{25} = \frac{3}{5}$,$P(X = 1) = \frac{6}{25} + \frac{4}{25} = \frac{2}{5}$ $P(Y = 0) = \frac{9}{25} + \frac{6}{25} = \frac{3}{5}$,$P(Y = 1) = \frac{6}{25} + \frac{4}{25} = \frac{2}{5}$ ===== 3.3 二维连续型随机变量 ===== ==== 3.3.1 联合概率密度 ==== **定义 3.5(联合概率密度)** 设 $(X, Y)$ 的联合分布函数为 $F(x, y)$,若存在非负可积函数 $f(x, y)$,使得 $$F(x, y) = \int_{-\infty}^{x}\int_{-\infty}^{y} f(u, v)dudv$$ 则称 $(X, Y)$ 为**二维连续型随机变量**,$f(x, y)$ 称为**联合概率密度函数**。 **性质:** 1. $f(x, y) \geq 0$ 2. $\int_{-\infty}^{+\infty}\int_{-\infty}^{+\infty} f(x, y)dxdy = 1$ 3. 若 $f(x, y)$ 在 $(x, y)$ 处连续,则 $\frac{\partial^2 F(x, y)}{\partial x \partial y} = f(x, y)$ 4. 对平面上区域 $G$:$P((X, Y) \in G) = \iint_G f(x, y)dxdy$ **例 3.3** 设 $(X, Y)$ 的联合密度为 $$f(x, y) = \begin{cases} Ce^{-(x+y)}, & x > 0, y > 0 \\ 0, & \text{其他} \end{cases}$$ (1) 求常数 $C$;(2) 求 $P(X + Y < 1)$。 **解:** (1) $\int_0^{\infty}\int_0^{\infty} Ce^{-(x+y)}dxdy = C\int_0^{\infty}e^{-x}dx \cdot \int_0^{\infty}e^{-y}dy = C \cdot 1 \cdot 1 = 1$ 故 $C = 1$。 (2) $P(X + Y < 1) = \iint_{x+y<1, x>0, y>0} e^{-(x+y)}dxdy$ $= \int_0^1 e^{-x}dx \int_0^{1-x} e^{-y}dy = \int_0^1 e^{-x}(1 - e^{-(1-x)})dx$ $= \int_0^1 (e^{-x} - e^{-1})dx = [-e^{-x} - xe^{-1}]_0^1 = 1 - 2e^{-1}$ ==== 3.3.2 边缘概率密度 ==== **定义 3.6(边缘概率密度)** 设 $(X, Y)$ 的联合密度为 $f(x, y)$,则 $X$ 的边缘密度:$f_X(x) = \int_{-\infty}^{+\infty} f(x, y)dy$ $Y$ 的边缘密度:$f_Y(y) = \int_{-\infty}^{+\infty} f(x, y)dx$ **例 3.4** 接上例,求边缘密度。 **解:** $$f_X(x) = \int_0^{\infty} e^{-(x+y)}dy = e^{-x} \cdot 1 = e^{-x}$$($x > 0$) 即 $X \sim E(1)$,同理 $Y \sim E(1)$。 ==== 3.3.3 常见二维分布 ===== **1. 二维均匀分布** 设 $G$ 是平面上的有界区域,面积为 $S_G$,若 $(X, Y)$ 的联合密度为 $$f(x, y) = \begin{cases} \frac{1}{S_G}, & (x, y) \in G \\ 0, & \text{其他} \end{cases}$$ 则称 $(X, Y)$ 服从 $G$ 上的**二维均匀分布**。 **2. 二维正态分布** 若 $(X, Y)$ 的联合密度为 $$f(x, y) = \frac{1}{2\pi\sigma_1\sigma_2\sqrt{1-\rho^2}} \exp\left\{-\frac{1}{2(1-\rho^2)}\left[\frac{(x-\mu_1)^2}{\sigma_1^2} - 2\rho\frac{(x-\mu_1)(y-\mu_2)}{\sigma_1\sigma_2} + \frac{(y-\mu_2)^2}{\sigma_2^2}\right]\right\}$$ 其中 $\mu_1, \mu_2, \sigma_1 > 0, \sigma_2 > 0, |\rho| < 1$ 为参数,则称 $(X, Y)$ 服从**二维正态分布**,记为 $(X, Y) \sim N(\mu_1, \mu_2, \sigma_1^2, \sigma_2^2, \rho)$。 ===== 3.4 条件分布 ===== ==== 3.4.1 离散型的条件分布 ==== **定义 3.7(条件分布律)** 设 $(X, Y)$ 是二维离散型随机变量,对固定的 $j$,若 $P(Y = y_j) > 0$,则称 $$P(X = x_i | Y = y_j) = \frac{P(X = x_i, Y = y_j)}{P(Y = y_j)} = \frac{p_{ij}}{p_{\cdot j}}$$ 为在 $Y = y_j$ 条件下 $X$ 的**条件分布律**。 ==== 3.4.2 连续型的条件分布 ==== **定义 3.8(条件概率密度)** 设 $(X, Y)$ 是二维连续型随机变量,若 $f_Y(y) > 0$,则称 $$f_{X|Y}(x|y) = \frac{f(x, y)}{f_Y(y)}$$ 为在 $Y = y$ 条件下 $X$ 的**条件概率密度**。 相应地,条件分布函数: $$F_{X|Y}(x|y) = \int_{-\infty}^{x} f_{X|Y}(u|y)du$$ **例 3.5** 设 $(X, Y)$ 在圆域 $x^2 + y^2 \leq 1$ 上服从均匀分布,求 $f_{X|Y}(x|y)$。 **解:** 联合密度 $f(x, y) = \frac{1}{\pi}$($x^2 + y^2 \leq 1$) $Y$ 的边缘密度: $$f_Y(y) = \int_{-\sqrt{1-y^2}}^{\sqrt{1-y^2}} \frac{1}{\pi}dx = \frac{2\sqrt{1-y^2}}{\pi}$$($|y| < 1$) $$f_{X|Y}(x|y) = \frac{1/\pi}{2\sqrt{1-y^2}/\pi} = \frac{1}{2\sqrt{1-y^2}}$$ ($-\sqrt{1-y^2} < x < \sqrt{1-y^2}$) 即在 $Y = y$ 条件下,$X$ 在 $(-\sqrt{1-y^2}, \sqrt{1-y^2})$ 上服从均匀分布。 ===== 3.5 随机变量的独立性 ===== ==== 3.5.1 独立性的定义 ==== **定义 3.9(独立性)** 设 $F(x, y)$ 及 $F_X(x), F_Y(y)$ 分别是 $(X, Y)$ 的联合分布函数及边缘分布函数,若对任意 $x, y$: $$F(x, y) = F_X(x)F_Y(y)$$ 则称随机变量 $X$ 与 $Y$ **相互独立**。 ==== 3.5.2 独立性的判定 ==== **离散型:** $X$ 与 $Y$ 独立 $\Leftrightarrow p_{ij} = p_{i\cdot} \cdot p_{\cdot j}$(对所有 $i, j$) **连续型:** $X$ 与 $Y$ 独立 $\Leftrightarrow f(x, y) = f_X(x)f_Y(y)$(几乎处处) **定理 3.1** 设 $(X, Y) \sim N(\mu_1, \mu_2, \sigma_1^2, \sigma_2^2, \rho)$,则 $X$ 与 $Y$ 相互独立的充分必要条件是 $\rho = 0$。 **例 3.6** 接上例(圆域均匀分布),$X$ 与 $Y$ 是否独立? **解:** $f_X(x) = \frac{2\sqrt{1-x^2}}{\pi}$($|x| < 1$) $f(x, y) = \frac{1}{\pi} \neq \frac{4\sqrt{1-x^2}\sqrt{1-y^2}}{\pi^2} = f_X(x)f_Y(y)$ 故 $X$ 与 $Y$ **不独立**。 **例 3.7** 设 $X \sim U(0, 1)$,在 $X = x$ 条件下 $Y \sim U(0, x)$,求: (1) 联合密度 $f(x, y)$;(2) $Y$ 的边缘密度;(3) $P(X + Y > 1)$。 **解:** (1) $f_X(x) = 1$($0 < x < 1$),$f_{Y|X}(y|x) = \frac{1}{x}$($0 < y < x$) $f(x, y) = f_X(x)f_{Y|X}(y|x) = \frac{1}{x}$($0 < y < x < 1$) (2) $f_Y(y) = \int_y^1 \frac{1}{x}dx = -\ln y$($0 < y < 1$) (3) $P(X + Y > 1) = \iint_{x+y>1} \frac{1}{x}dxdy = \int_{1/2}^1 dx \int_{1-x}^x \frac{1}{x}dy$ $= \int_{1/2}^1 \frac{2x-1}{x}dx = \int_{1/2}^1 (2 - \frac{1}{x})dx = [2x - \ln x]_{1/2}^1 = 1 - \ln 2$ ===== 3.6 两个随机变量函数的分布 ===== ==== 3.6.1 离散型情形 ==== **例 3.8** 设 $X, Y$ 独立同分布,$P(X = 0) = P(X = 1) = \frac{1}{2}$,求 $Z = X + Y$ 的分布律。 **解:** | $(X, Y)$ | $(0, 0)$ | $(0, 1)$ | $(1, 0)$ | $(1, 1)$ | |----------|----------|----------|----------|----------| | $Z$ | 0 | 1 | 1 | 2 | | $P$ | $\frac{1}{4}$ | $\frac{1}{4}$ | $\frac{1}{4}$ | $\frac{1}{4}$ | $P(Z = 0) = \frac{1}{4}$,$P(Z = 1) = \frac{1}{2}$,$P(Z = 2) = \frac{1}{4}$ ==== 3.6.2 连续型情形 ==== **分布函数法:** $$F_Z(z) = P(Z \leq z) = P(g(X, Y) \leq z) = \iint_{g(x,y) \leq z} f(x, y)dxdy$$ **卷积公式($Z = X + Y$):** $$f_Z(z) = \int_{-\infty}^{+\infty} f(x, z-x)dx = \int_{-\infty}^{+\infty} f(z-y, y)dy$$ 当 $X, Y$ 独立时: $$f_Z(z) = \int_{-\infty}^{+\infty} f_X(x)f_Y(z-x)dx = f_X * f_Y$$ (称为 $f_X$ 与 $f_Y$ 的卷积) **例 3.9** 设 $X \sim N(0, 1)$,$Y \sim N(0, 1)$,$X, Y$ 独立,求 $Z = X + Y$ 的分布。 **解:** $$\begin{aligned} f_Z(z) &= \int_{-\infty}^{+\infty} \frac{1}{\sqrt{2\pi}}e^{-\frac{x^2}{2}} \cdot \frac{1}{\sqrt{2\pi}}e^{-\frac{(z-x)^2}{2}}dx \\ &= \frac{1}{2\pi}\int_{-\infty}^{+\infty} e^{-\frac{x^2+(z-x)^2}{2}}dx \\ &= \frac{1}{2\pi}e^{-\frac{z^2}{4}}\int_{-\infty}^{+\infty} e^{-(x-\frac{z}{2})^2}dx \\ &= \frac{1}{2\pi}e^{-\frac{z^2}{4}}\sqrt{\pi} = \frac{1}{\sqrt{2\pi}\sqrt{2}}e^{-\frac{z^2}{2(\sqrt{2})^2}} \end{aligned}$$ 故 $Z \sim N(0, 2)$。 **定理 3.2** 设 $X \sim N(\mu_1, \sigma_1^2)$,$Y \sim N(\mu_2, \sigma_2^2)$,$X, Y$ 独立,则 $$X + Y \sim N(\mu_1 + \mu_2, \sigma_1^2 + \sigma_2^2)$$ **极值分布:** 设 $X, Y$ 独立,分布函数分别为 $F_X(x), F_Y(y)$,则 $M = \max(X, Y)$ 的分布函数:$F_M(z) = F_X(z)F_Y(z)$ $N = \min(X, Y)$ 的分布函数:$F_N(z) = 1 - [1-F_X(z)][1-F_Y(z)]$ ===== 3.7 典型例题 ===== **例题 3.1** 设 $(X, Y)$ 的联合密度为 $$f(x, y) = \begin{cases} 6x, & 0 \leq x \leq y \leq 1 \\ 0, & \text{其他} \end{cases}$$ 求:(1) $P(X + Y \leq 1)$;(2) 边缘密度;(3) 判断独立性。 **解:** (1) $P(X + Y \leq 1) = \int_0^{1/2} 6x dx \int_x^{1-x} dy = \int_0^{1/2} 6x(1-2x)dx = [3x^2 - 4x^3]_0^{1/2} = \frac{1}{4}$ (2) $f_X(x) = \int_x^1 6x dy = 6x(1-x)$($0 < x < 1$) $f_Y(y) = \int_0^y 6x dx = 3y^2$($0 < y < 1$) (3) $f(x, y) = 6x \neq 18xy^2(1-x) = f_X(x)f_Y(y)$,不独立。 ===== 3.8 习题 ===== **基础题** 1. 设 $(X, Y)$ 的联合分布律为 | $X \backslash Y$ | 0 | 1 | |------------------|---|---| | 0 | 0.4 | 0.1 | | 1 | 0.2 | 0.3 | 求:(1) 边缘分布律;(2) 判断 $X, Y$ 是否独立。 2. 设 $(X, Y)$ 的联合密度为 $f(x, y) = e^{-y}$($0 < x < y$),求边缘密度。 **提高题** 3. 设 $X, Y$ 独立,$X \sim U(0, 1)$,$Y$ 的密度为 $f_Y(y) = \begin{cases} 2y, & 0 < y < 1 \\ 0, & \text{其他} \end{cases}$,求 $Z = X + Y$ 的密度。 4. 设 $(X, Y) \sim N(0, 0, 1, 1, \rho)$,求 $X - Y$ 的分布。 **挑战题** 5. 设 $X_1, X_2, \ldots, X_n$ 独立同分布于 $U(0, 1)$,求 $M = \max(X_1, \ldots, X_n)$ 和 $N = \min(X_1, \ldots, X_n)$ 的分布。