目录

第三章 多维随机变量

3.1 二维随机变量及其分布

3.1.1 二维随机变量的概念

定义 3.1(二维随机变量) 设 $E$ 是随机试验,样本空间为 $\Omega$,$X = X(\omega)$ 和 $Y = Y(\omega)$ 是定义在 $\Omega$ 上的随机变量,则由它们构成的向量 $(X, Y)$ 称为二维随机变量二维随机向量

意义: 很多随机现象需要两个或多个随机变量来描述。 - 炮弹落点:$(X, Y)$ 表示横纵坐标 - 人体测量:$(X, Y)$ 表示身高和体重

3.1.2 联合分布函数

定义 3.2(联合分布函数) 设 $(X, Y)$ 是二维随机变量,对任意实数 $x, y$,二元函数 $$F(x, y) = P(X \leq x, Y \leq y)$$ 称为 $(X, Y)$ 的联合分布函数

几何意义: $F(x, y)$ 表示随机点 $(X, Y)$ 落在以 $(x, y)$ 为顶点的左下方无穷矩形内的概率。

性质: 1. $0 \leq F(x, y) \leq 1$ 2. $F(x, y)$ 关于 $x$ 和 $y$ 都是单调不减的 3. $F(x, y)$ 关于 $x$ 和 $y$ 都是右连续的 4. $F(-\infty, y) = F(x, -\infty) = 0$,$F(+\infty, +\infty) = 1$ 5. 对任意 $x_1 < x_2$,$y_1 < y_2$:

 $$P(x_1 < X \leq x_2, y_1 < Y \leq y_2) = F(x_2, y_2) - F(x_2, y_1) - F(x_1, y_2) + F(x_1, y_1)$$

3.2 二维离散型随机变量

3.2.1 联合分布律

定义 3.3(联合分布律) 若二维随机变量 $(X, Y)$ 的所有可能取值为有限对或可列无限对 $(x_i, y_j)$,则称 $(X, Y)$ 为二维离散型随机变量

记 $P(X = x_i, Y = y_j) = p_{ij}$($i, j = 1, 2, \ldots$),称为 $(X, Y)$ 的联合分布律

性质: 1. $p_{ij} \geq 0$ 2. $\sum_{i=1}^{\infty}\sum_{j=1}^{\infty} p_{ij} = 1$

常用表格表示:

$X \backslash Y$ $y_1$ $y_2$ $\cdots$ $y_j$ $\cdots$
————————-——-———-——-———-
$x_1$ $p_{11}$ $p_{12}$ $\cdots$ $p_{1j}$ $\cdots$
$x_2$ $p_{21}$ $p_{22}$ $\cdots$ $p_{2j}$ $\cdots$
$\vdots$ $\vdots$ $\vdots$ $\ddots$ $\vdots$
$x_i$ $p_{i1}$ $p_{i2}$ $\cdots$ $p_{ij}$ $\cdots$

例 3.1 袋中有 2 白 3 黑球,取两次,$X$ 表示第一次取到白球数(0 或 1),$Y$ 表示第二次取到白球数。分别就(1)有放回(2)无放回求联合分布律。

解: (1)有放回:

$X \backslash Y$ 0 1
——————
0 $\frac{9}{25}$ $\frac{6}{25}$
1 $\frac{6}{25}$ $\frac{4}{25}$

(2)无放回:

$X \backslash Y$ 0 1
——————
0 $\frac{6}{20}$ $\frac{6}{20}$
1 $\frac{6}{20}$ $\frac{2}{20}$

3.2.2 边缘分布律

定义 3.4(边缘分布律) 设 $(X, Y)$ 的联合分布律为 $p_{ij}$,则

$X$ 的边缘分布律:$P(X = x_i) = \sum_{j=1}^{\infty} p_{ij} = p_{i\cdot}$

$Y$ 的边缘分布律:$P(Y = y_j) = \sum_{i=1}^{\infty} p_{ij} = p_{\cdot j}$

例 3.2 接上例,求边缘分布律。

解: (有放回情形)

$P(X = 0) = \frac{9}{25} + \frac{6}{25} = \frac{3}{5}$,$P(X = 1) = \frac{6}{25} + \frac{4}{25} = \frac{2}{5}$

$P(Y = 0) = \frac{9}{25} + \frac{6}{25} = \frac{3}{5}$,$P(Y = 1) = \frac{6}{25} + \frac{4}{25} = \frac{2}{5}$

3.3 二维连续型随机变量

3.3.1 联合概率密度

定义 3.5(联合概率密度) 设 $(X, Y)$ 的联合分布函数为 $F(x, y)$,若存在非负可积函数 $f(x, y)$,使得 $$F(x, y) = \int_{-\infty}^{x}\int_{-\infty}^{y} f(u, v)dudv$$ 则称 $(X, Y)$ 为二维连续型随机变量,$f(x, y)$ 称为联合概率密度函数

性质: 1. $f(x, y) \geq 0$ 2. $\int_{-\infty}^{+\infty}\int_{-\infty}^{+\infty} f(x, y)dxdy = 1$ 3. 若 $f(x, y)$ 在 $(x, y)$ 处连续,则 $\frac{\partial^2 F(x, y)}{\partial x \partial y} = f(x, y)$ 4. 对平面上区域 $G$:$P((X, Y) \in G) = \iint_G f(x, y)dxdy$

例 3.3 设 $(X, Y)$ 的联合密度为 $$f(x, y) = \begin{cases} Ce^{-(x+y)}, & x > 0, y > 0
0, & \text{其他} \end{cases}$$

(1) 求常数 $C$;(2) 求 $P(X + Y < 1)$。

解: (1) $\int_0^{\infty}\int_0^{\infty} Ce^{-(x+y)}dxdy = C\int_0^{\infty}e^{-x}dx \cdot \int_0^{\infty}e^{-y}dy = C \cdot 1 \cdot 1 = 1$

故 $C = 1$。

(2) $P(X + Y < 1) = \iint_{x+y<1, x>0, y>0} e^{-(x+y)}dxdy$

$= \int_0^1 e^{-x}dx \int_0^{1-x} e^{-y}dy = \int_0^1 e^{-x}(1 - e^{-(1-x)})dx$

$= \int_0^1 (e^{-x} - e^{-1})dx = [-e^{-x} - xe^{-1}]_0^1 = 1 - 2e^{-1}$

3.3.2 边缘概率密度

定义 3.6(边缘概率密度) 设 $(X, Y)$ 的联合密度为 $f(x, y)$,则

$X$ 的边缘密度:$f_X(x) = \int_{-\infty}^{+\infty} f(x, y)dy$

$Y$ 的边缘密度:$f_Y(y) = \int_{-\infty}^{+\infty} f(x, y)dx$

例 3.4 接上例,求边缘密度。

解: $$f_X(x) = \int_0^{\infty} e^{-(x+y)}dy = e^{-x} \cdot 1 = e^{-x}$$($x > 0$)

即 $X \sim E(1)$,同理 $Y \sim E(1)$。

3.3.3 常见二维分布

1. 二维均匀分布

设 $G$ 是平面上的有界区域,面积为 $S_G$,若 $(X, Y)$ 的联合密度为 $$f(x, y) = \begin{cases} \frac{1}{S_G}, & (x, y) \in G
0, & \text{其他} \end{cases}$$ 则称 $(X, Y)$ 服从 $G$ 上的二维均匀分布

2. 二维正态分布

若 $(X, Y)$ 的联合密度为 $$f(x, y) = \frac{1}{2\pi\sigma_1\sigma_2\sqrt{1-\rho^2}} \exp\left\{-\frac{1}{2(1-\rho^2)}\left[\frac{(x-\mu_1)^2}{\sigma_1^2} - 2\rho\frac{(x-\mu_1)(y-\mu_2)}{\sigma_1\sigma_2} + \frac{(y-\mu_2)^2}{\sigma_2^2}\right]\right\}$$

其中 $\mu_1, \mu_2, \sigma_1 > 0, \sigma_2 > 0, |\rho| < 1$ 为参数,则称 $(X, Y)$ 服从二维正态分布,记为 $(X, Y) \sim N(\mu_1, \mu_2, \sigma_1^2, \sigma_2^2, \rho)$。

3.4 条件分布

3.4.1 离散型的条件分布

定义 3.7(条件分布律) 设 $(X, Y)$ 是二维离散型随机变量,对固定的 $j$,若 $P(Y = y_j) > 0$,则称 $$P(X = x_i | Y = y_j) = \frac{P(X = x_i, Y = y_j)}{P(Y = y_j)} = \frac{p_{ij}}{p_{\cdot j}}$$ 为在 $Y = y_j$ 条件下 $X$ 的条件分布律

3.4.2 连续型的条件分布

定义 3.8(条件概率密度) 设 $(X, Y)$ 是二维连续型随机变量,若 $f_Y(y) > 0$,则称 $$f_{X|Y}(x|y) = \frac{f(x, y)}{f_Y(y)}$$ 为在 $Y = y$ 条件下 $X$ 的条件概率密度

相应地,条件分布函数: $$F_{X|Y}(x|y) = \int_{-\infty}^{x} f_{X|Y}(u|y)du$$

例 3.5 设 $(X, Y)$ 在圆域 $x^2 + y^2 \leq 1$ 上服从均匀分布,求 $f_{X|Y}(x|y)$。

解: 联合密度 $f(x, y) = \frac{1}{\pi}$($x^2 + y^2 \leq 1$)

$Y$ 的边缘密度: $$f_Y(y) = \int_{-\sqrt{1-y^2}}^{\sqrt{1-y^2}} \frac{1}{\pi}dx = \frac{2\sqrt{1-y^2}}{\pi}$$($|y| < 1$)

$$f_{X|Y}(x|y) = \frac{1/\pi}{2\sqrt{1-y^2}/\pi} = \frac{1}{2\sqrt{1-y^2}}$$ ($-\sqrt{1-y^2} < x < \sqrt{1-y^2}$)

即在 $Y = y$ 条件下,$X$ 在 $(-\sqrt{1-y^2}, \sqrt{1-y^2})$ 上服从均匀分布。

3.5 随机变量的独立性

3.5.1 独立性的定义

定义 3.9(独立性) 设 $F(x, y)$ 及 $F_X(x), F_Y(y)$ 分别是 $(X, Y)$ 的联合分布函数及边缘分布函数,若对任意 $x, y$: $$F(x, y) = F_X(x)F_Y(y)$$ 则称随机变量 $X$ 与 $Y$ 相互独立

3.5.2 独立性的判定

离散型: $X$ 与 $Y$ 独立 $\Leftrightarrow p_{ij} = p_{i\cdot} \cdot p_{\cdot j}$(对所有 $i, j$)

连续型: $X$ 与 $Y$ 独立 $\Leftrightarrow f(x, y) = f_X(x)f_Y(y)$(几乎处处)

定理 3.1 设 $(X, Y) \sim N(\mu_1, \mu_2, \sigma_1^2, \sigma_2^2, \rho)$,则 $X$ 与 $Y$ 相互独立的充分必要条件是 $\rho = 0$。

例 3.6 接上例(圆域均匀分布),$X$ 与 $Y$ 是否独立?

解: $f_X(x) = \frac{2\sqrt{1-x^2}}{\pi}$($|x| < 1$)

$f(x, y) = \frac{1}{\pi} \neq \frac{4\sqrt{1-x^2}\sqrt{1-y^2}}{\pi^2} = f_X(x)f_Y(y)$

故 $X$ 与 $Y$ 不独立

例 3.7 设 $X \sim U(0, 1)$,在 $X = x$ 条件下 $Y \sim U(0, x)$,求: (1) 联合密度 $f(x, y)$;(2) $Y$ 的边缘密度;(3) $P(X + Y > 1)$。

解: (1) $f_X(x) = 1$($0 < x < 1$),$f_{Y|X}(y|x) = \frac{1}{x}$($0 < y < x$)

$f(x, y) = f_X(x)f_{Y|X}(y|x) = \frac{1}{x}$($0 < y < x < 1$)

(2) $f_Y(y) = \int_y^1 \frac{1}{x}dx = -\ln y$($0 < y < 1$)

(3) $P(X + Y > 1) = \iint_{x+y>1} \frac{1}{x}dxdy = \int_{1/2}^1 dx \int_{1-x}^x \frac{1}{x}dy$

$= \int_{1/2}^1 \frac{2x-1}{x}dx = \int_{1/2}^1 (2 - \frac{1}{x})dx = [2x - \ln x]_{1/2}^1 = 1 - \ln 2$

3.6 两个随机变量函数的分布

3.6.1 离散型情形

例 3.8 设 $X, Y$ 独立同分布,$P(X = 0) = P(X = 1) = \frac{1}{2}$,求 $Z = X + Y$ 的分布律。

解:

$(X, Y)$ $(0, 0)$ $(0, 1)$ $(1, 0)$ $(1, 1)$
———-———-———-———-———-
$Z$ 0 1 1 2
$P$ $\frac{1}{4}$ $\frac{1}{4}$ $\frac{1}{4}$ $\frac{1}{4}$

$P(Z = 0) = \frac{1}{4}$,$P(Z = 1) = \frac{1}{2}$,$P(Z = 2) = \frac{1}{4}$

3.6.2 连续型情形

分布函数法: $$F_Z(z) = P(Z \leq z) = P(g(X, Y) \leq z) = \iint_{g(x,y) \leq z} f(x, y)dxdy$$

卷积公式($Z = X + Y$): $$f_Z(z) = \int_{-\infty}^{+\infty} f(x, z-x)dx = \int_{-\infty}^{+\infty} f(z-y, y)dy$$

当 $X, Y$ 独立时: $$f_Z(z) = \int_{-\infty}^{+\infty} f_X(x)f_Y(z-x)dx = f_X * f_Y$$ (称为 $f_X$ 与 $f_Y$ 的卷积)

例 3.9 设 $X \sim N(0, 1)$,$Y \sim N(0, 1)$,$X, Y$ 独立,求 $Z = X + Y$ 的分布。

解: $$\begin{aligned} f_Z(z) &= \int_{-\infty}^{+\infty} \frac{1}{\sqrt{2\pi}}e^{-\frac{x^2}{2}} \cdot \frac{1}{\sqrt{2\pi}}e^{-\frac{(z-x)^2}{2}}dx
&= \frac{1}{2\pi}\int_{-\infty}^{+\infty} e^{-\frac{x^2+(z-x)^2}{2}}dx
&= \frac{1}{2\pi}e^{-\frac{z^2}{4}}\int_{-\infty}^{+\infty} e^{-(x-\frac{z}{2})^2}dx
&= \frac{1}{2\pi}e^{-\frac{z^2}{4}}\sqrt{\pi} = \frac{1}{\sqrt{2\pi}\sqrt{2}}e^{-\frac{z^2}{2(\sqrt{2})^2}} \end{aligned}$$

故 $Z \sim N(0, 2)$。

定理 3.2 设 $X \sim N(\mu_1, \sigma_1^2)$,$Y \sim N(\mu_2, \sigma_2^2)$,$X, Y$ 独立,则 $$X + Y \sim N(\mu_1 + \mu_2, \sigma_1^2 + \sigma_2^2)$$

极值分布: 设 $X, Y$ 独立,分布函数分别为 $F_X(x), F_Y(y)$,则

$M = \max(X, Y)$ 的分布函数:$F_M(z) = F_X(z)F_Y(z)$

$N = \min(X, Y)$ 的分布函数:$F_N(z) = 1 - [1-F_X(z)][1-F_Y(z)]$

3.7 典型例题

例题 3.1 设 $(X, Y)$ 的联合密度为 $$f(x, y) = \begin{cases} 6x, & 0 \leq x \leq y \leq 1
0, & \text{其他} \end{cases}$$

求:(1) $P(X + Y \leq 1)$;(2) 边缘密度;(3) 判断独立性。

解: (1) $P(X + Y \leq 1) = \int_0^{1/2} 6x dx \int_x^{1-x} dy = \int_0^{1/2} 6x(1-2x)dx = [3x^2 - 4x^3]_0^{1/2} = \frac{1}{4}$

(2) $f_X(x) = \int_x^1 6x dy = 6x(1-x)$($0 < x < 1$)

$f_Y(y) = \int_0^y 6x dx = 3y^2$($0 < y < 1$)

(3) $f(x, y) = 6x \neq 18xy^2(1-x) = f_X(x)f_Y(y)$,不独立。

3.8 习题

基础题 1. 设 $(X, Y)$ 的联合分布律为

 | $X \backslash Y$ | 0 | 1 |
 |------------------|---|---|
 | 0 | 0.4 | 0.1 |
 | 1 | 0.2 | 0.3 |
 
 求:(1) 边缘分布律;(2) 判断 $X, Y$ 是否独立。

2. 设 $(X, Y)$ 的联合密度为 $f(x, y) = e^{-y}$($0 < x < y$),求边缘密度。

提高题 3. 设 $X, Y$ 独立,$X \sim U(0, 1)$,$Y$ 的密度为 $f_Y(y) = \begin{cases} 2y, & 0 < y < 1
0, & \text{其他} \end{cases}$,求 $Z = X + Y$ 的密度。

4. 设 $(X, Y) \sim N(0, 0, 1, 1, \rho)$,求 $X - Y$ 的分布。

挑战题 5. 设 $X_1, X_2, \ldots, X_n$ 独立同分布于 $U(0, 1)$,求 $M = \max(X_1, \ldots, X_n)$ 和 $N = \min(X_1, \ldots, X_n)$ 的分布。

<html> <script type=“text/javascript” async

src="https://cdn.jsdelivr.net/npm/mathjax@3/es5/tex-mml-chtml.js">

</script> </html>