【概率论】多维随机变量及其分布-摩杜云开发者社区

二维随机变量

一、二维随机变量的定义

设$E$是一个随机变量，它的样本空间是$S={e}$，设$X=X(e)$和$Y=Y(e)$是定义在$S$上的随机变量，由它们构成一个向量$(X,Y)$叫做二维随机变量

二、分布函数的定义

设$(X,Y)$是二维随机变量，对于任意实数$x,y$，均存在二元函数$F(x,y)=P{(X\leq x)\cap (Y\leq y)}$记作$P{X\leq x,Y\leq y}$，故将$F(x,y)$称为二维随机变量$(X,Y)$的分布函数，或称为随机变量$X$和$Y$的联合分布函数

三、分布函数的性质

1. 单调不减

任意固定$y$，当$x_{2}>x_{1}$时，$F(x_{2},y)\geq F(x_{1},y)$；任意固定$x$，当$y_{2}>y_{1}$时，$F(x,y_{2})\geq F(x,y_{1})$

2. 规范性

$0\leq F(x,y)\leq1$，且$F(-\infty,y)=F(x,-\infty)=F(-\infty,-\infty)=0,F(+\infty,+\infty)=1$

3. 右连续

$F(x+0,y)=F(x,y),F(x,y+0)=F(x,y)$，即函数$F(x,y)$关于$x,y$均右连续

4. 非负性

对于任意的$x_{1}<x_{2},y_{1}<y_{2}$，不等式$F(x_{2},y_{2})-F(x_{2},y_{1})+F(x_{1},y_{1})-F(x_{1},y_{2})\geq 0$成立

推导：

$\begin{aligned}\quad&P{X\leq x_{2},Y\leq y_{2}}-P{X\leq x_{2},Y\leq y_{1}}+P{X\leq x_{1},Y\leq y_{1}}-P{X\leq x_{1},Y\leq y_{2}}\=&P{X\leq x_{2},y_{1}<Y\leq y_{2}}-P{X\leq x_{2},y_{1}<Y\leq y_{2}}\=&P{x_{1}<X\leq x_{2},y_{1}<Y\leq y_{2}}\end{aligned}$

四、二维离散型随机变量

1. 定义

如果二维随机变量$(X,Y)$全部可能取到的值是有限对或可列无限多对，则称$(X,Y)$是离散型的随机变量

2. 性质

非负性：$p_{ij}\geq 0$
规范性：$\sum\limits^{\infty}{i=1}\sum\limits^{\infty}{j=1}p_{ij}=1$

3. 联合分布律

$P{X=x_{i},Y=y_{j}}=p_{ij},\quad i,j=1,2,\cdots$为二维离散型随机变量$(X,Y)$联合分布律

例1：设随机变量$X$在$1,2,3,4$四个正数中等可能地取一个值，另一个随机变量$Y$在$1$到$X$中等可能地取一整数值，试求$(X,Y)$的分布律

$X$\ $Y$	$1$	$2$	$3$	$4$
$1$	$\frac{1}{4}$	$0$	$0$	$0$
$2$	$\frac{1}{8}$	$\frac{1}{8}$	$0$	$0$
$3$	$\frac{1}{12}$	$\frac{1}{12}$	$\frac{1}{12}$	$0$
$4$	$\frac{1}{16}$	$\frac{1}{16}$	$\frac{1}{16}$	$\frac{1}{16}$

五、二维连续性随机变量

1. 定义

如果存在非负可积函数$f(x,y)$，使对于任意$x,y$都有$F(x,y)=\int^{y}{-\infty}\int^{x}{-\infty}f(u,v)dudv$，则称$(X,Y)$是连续型的二维随机变量，函数$f(x,y)$称为二维随机变量$(X,Y)$的概率密度，或者称为随机变量$X$和$Y$的联合概率密度

2. 性质

$f(x,y)\geq 0$
规范性：$\int^{+\infty}{-\infty}\int^{+\infty}{-\infty}f(x,y)dxdy=F(+\infty,+\infty)=1$

3. 求法

$P{(X,Y)\in D}=\iint_{(x,y)\in D}f(x,y)$

例2：设二维随机变量$(X,Y)$具有概率密度$f(x,y)=\begin{cases}2e^{-(2x+y)},x>0,y>0\0,\quad\text{其他}\end{cases}$，求

分布函数$F(x,y)$

$F(x,y)=\int^{x}{-\infty}du\int^{y}{-\infty}f(u,v)dv=\begin{cases}\int^{x}{0}du\int^{y}{0}2e^{-(2u+v)}dv=(1-e^{-2x})(1-e^{-y}),x>0,y>0\0,\quad\text{其他}\end{cases}$

$P{Y\leq X}$的概率

$\begin{aligned}P{Y\leq X}&=\iint\limits_{y\leq x}f(x,y)dxdy\&=\int^{+\infty}{0}dx\int^{x}{0}2e^{-(2x+y)}dy\&=\frac{1}{3}\end{aligned}$

边缘分布

一、定义

1. 边缘分布函数

二维随机变量$(X,Y)$作为一个整体，具有分布函数$F(x,y)$，而$X$和$Y$都是随机变量，各自也有分布函数，将它们分别记为$F_{X}(x),F_{Y}(y)$，依次称为二维随机变量$(X,Y)$关于$X$和关于$Y$的边缘分布函数。边缘分布函数可以由$(X,Y)$的分布函数$F(x,y)$所确定

2. 边缘分布律

$X$的边缘分布律

$P{X=x_{i}}=\sum\limits^{\infty}{j=1}p{ij},i=1,2,\cdots$。即第$i$行的概率和

推导：$P{X=x_{i}}=P{X=x_{i},\bigcup\limits_{j}Y=y_{i}}=\sum\limits^{n}{j=1}P{X=x{i},Y=y_{i}}$

$Y$的边缘分布律

$P{Y=y_{i}}=\sum\limits^{\infty}{i=1}p{ij},j=1,2,\cdots$。即第$j$列的概率和

3. 边缘概率密度

$X$的边缘概率密度

$F_{X}(x)=\int^{+\infty}_{-\infty}f(x,y)dy$

推导：

$F(x,+\infty)=\int^{x}{-\infty}\int^{+\infty}{-\infty}f(u,v)dvdu$

两侧同时对$x$求导，得上式

$Y$的边缘概率密度

$F_{Y}(y)=\int^{+\infty}_{-\infty}f(x,y)dx$

例1：一整数$N$等可能地在$1,2,3,\cdots,10$十个值中取一个值，设$D=D(N)$是能整除$N$的正整数的个数，$F=F(N)$是能整除$N$的素数的个数（注：$1$不是素数），写出$D$和$F$的联合分布律，并求边缘分布律

样本点	$1$	$2$	$3$	$4$	$5$	$6$	$7$	$8$	$9$	$10$
$D$	$1$	$2$	$2$	$3$	$2$	$4$	$2$	$4$	$3$	$4$
$F$	$0$	$1$	$1$	$1$	$1$	$2$	$1$	$1$	$1$	$2$

则$D={1,2,3,4},F={0,1,2}$

$F$\ $D$	$1$	$2$	$3$	$4$	$P{F=j}$
$0$	$\frac{1}{10}$	$0$	$0$	$0$	$\frac{1}{10}$
$1$	$0$	$\frac{2}{5}$	$\frac{1}{5}$	$\frac{1}{10}$	$\frac{7}{10}$
$2$	$0$	$0$	$0$	$\frac{2}{10}$	$\frac{2}{10}$
$P{D=i}$	$\frac{1}{10}$	$\frac{4}{10}$	$\frac{2}{10}$	$\frac{3}{10}$

则边缘分布律为

$D$	$1$	$2$	$3$	$4$
$P$	$\frac{1}{10}$	$\frac{2}{5}$	$\frac{1}{5}$	$\frac{3}{10}$

$F$	$0$	$1$	$2$
$P$	$\frac{1}{10}$	$\frac{7}{10}$	$\frac{1}{5}$

例2：设随机变量$X$和$Y$具有联合概率密度$f(x,y)=\begin{cases}6,x^{2}\leq y\leq x\0,\quad \text{其他}\end{cases}$，求边缘概率密度$f_{X}(x)$和$f_{Y}(y)$

$f_X(x)=\int^{+\infty}{-\infty}f(x,y)dy=\begin{cases}\int^{x}{x^{2}}6dy=6(x-x^{2}),0<x<1\0,\quad\text{其他}\end{cases}$

$f_{Y}(y)=\int^{+\infty}{-\infty}f(x,y)dx=\begin{cases}\int^{\sqrt{y}}{y}6dx=6(\sqrt{y}-y),0<y<1\0,\quad\text{其他}\end{cases}$

条件分布

一、条件分布律的定义

设$(X,Y)$是二维分散型随机变量，对于固定的$j$，若$P{Y=y_{j}}>0$，则称$P{X=x_{i}|Y=y_{j}}=\frac{P{X=x_{i},Y=y_{j}}}{P{Y=y_{j}}}=\frac{p_{ij}}{p_{\cdot j}},i=1,2,\cdots$为在$Y=y_{j}$的条件下随机变量$X$的条件分布律。同样，对于固定的$i$，若$P{X=x_{i}}>0$，则称$P{Y=y_{j}|X=x_{i}}=\frac{P{X=x_{i},Y=y_{j}}}{P{X=x_{i}}}=\frac{p_{ij}}{p_{i\cdot }},j=1,2,\cdots$为在$X=x_{i}$的条件下随机变量$Y$的条件分布律。

即条件分布律=联合概率/边缘概率

二、条件概率密度的定义

设二维随机变量$(X,Y)$的概率密度为$f(x,y)$，$(X,Y)$关于$Y$的边缘概率密度为$f_{Y}(y)$，若对于固定的$y$，$f_{Y}(y)>0$，则称$\frac{f(x,y)}{f_{Y}(y)}$为在$Y=y$的条件下$X$的条件概率密度，记为$f_{X|Y}(x|y)=\frac{f(x,y)}{f_{Y}(y)}$。称$\int^{x}{-\infty}f{X|Y}(x|y)dx=\int^{x}{-\infty}\frac{f(x,y)}{f{Y}(y)}dx$为在$Y=y$的条件下$X$的条件分布函数，记为$P{X\leq x|Y=y}$或$F_{X|Y}(x|y)$。类似地，在$X=x$的条件下$Y$的概率密度为$\frac{f(x,y)}{f_{X}(x)}$，记为$f_{Y|X}(y|x)$；$X=x$的条件下$Y$的条件的条件分布函数为$\int^{y}{-\infty}\frac{f(x,y)}{f{X}(x)}dy$，记为$P{Y\leq y|X=x}$或$F_{Y|X}(y|x)$

三、两种重要的二维连续性随机变量

1. 均匀分布

设$G$是平面上的有界区域，其面积为$A$，若二维随机变量$(X,Y)$具有概率密度$f(x,y)=\begin{cases}\frac{1}{A},(x,y)\in G\0,\quad\text{其他}\end{cases}$，则称$(X,Y)$在$G$上服从均匀分布，记作$(X,Y)\sim U(G)$

2. 二维正态分布

若二维连续型随机变量$(X,Y)$的概率密度为$f(x,y)=\frac{1}{2\pi \sigma_{1}\sigma_{2}\sqrt{1-\rho^{2}}}e^{-\frac{1}{2(1-\rho^{2})}\Big[\frac{(x-\mu_{1})^{2}}{\sigma_{1}^{2}}-\frac{2\rho(x-\mu_{1})(y-\mu_{2})}{\sigma_{1}\sigma_{2}}+\frac{(y-\sigma_{2})^{2}}{\sigma_{2}^{2}}\Big]},-\infty<x<+\infty,-\infty<y<+\infty$，其中$\mu_{1},\mu_{2},\sigma_{1}>0,\sigma_{2}>0,-1<\rho<1$均为常数，则称$(X,Y)$服从参数为$\mu_{1},\mu_{2},\sigma_{1},\sigma_{2}$和$\rho$的二维正态分布，记作$(X,Y)\sim N(\mu_{1},\mu_{2};\sigma_{1}^{2},\sigma_{2}^{2};\rho)$

例1：设二维随机变量$(X,Y)$在圆域$x^{2}+y^{2}\leq1$上服从均匀分布，求条件概率密度$f_{X|Y}(x|y)$

$S=\pi$

$\therefore f(x,y)=\begin{cases}\frac{1}{\pi},x^{2}+y^{2}\leq1\0,\text{其他}\end{cases}$

$f_{Y}(y)=\int^{+\infty}{-\infty}f(x,y)dx=\begin{cases}\int^{\sqrt{1-y^{2}}}{-\sqrt{1-y^{2}}}\frac{1}{\pi}dx=\frac{2}{\pi}\sqrt{1-y^{2}},-1<y<1\0,\quad\text{其他}\end{cases}$

当$-1<y<1$时

$f_{X|Y}(x|y)=\frac{f(x,y)}{f_{Y}(y)}=\begin{cases}\frac{1}{2\sqrt{1-y^{2}}},-\sqrt{1-y^{2}}<x<\sqrt{1-y^{2}}\0,\quad\text{其他}\end{cases}$

例2：设$X\sim U(0,1)$，当观察到$X=x(0<x<1)$时，$Y$服从$(x,1)$上的均匀分布，求$Y$的概率密度$f_{Y}(y)$

$f_{X}(x)=\begin{cases}\frac{1}{1}=1,0<x<1\0,\quad\text{其他}\end{cases}$

$f_{Y|X}(y|x)=\begin{cases}\frac{1}{1-x},0<x<y<1\0,\quad\text{其他}\end{cases}$

则$f(x,y)=f_{X}(x)\cdot f_{Y|X}(y|x)=\begin{cases}\frac{1}{1-x},0<x<y<1\0,\quad\text{其他}\end{cases}$

则$f_{Y}(y)=\int^{+\infty}{-\infty}f(x,y)dx=\begin{cases}\int^{y}{0}\frac{1}{1-x}dx=-\ln(1-y),0<y<1\0,\quad\text{其他}\end{cases}$

四、随机变量的相互独立

1. 定义

若对于所有的$x,y$，均有$P{X\leq x,Y\leq y}=P{X\leq x}P{Y\leq y}$，即$F(x,y)=F_{X}(x)F_{Y}(y)$，则称随机变量$X$与$Y$是相互独立的

联合概率=边缘概率的乘积，即联合分布函数=边缘分布函数的乘积

2. 充要条件

设$(X,Y)$是连续型随机变量，则$X$和$Y$相互独立$\Leftrightarrow f(x,y)=f_{X}(x)f_{Y}(y)$

即联合概率密度=边缘概率密度乘积

设$(X,Y)$是离散型随机变量，则$X$和$Y$相互独立$\Leftrightarrow P{X=x_{i},Y=y_{j}}=P{X=x_{i}}P{Y=y_{i}}$

即联合概率=边缘概率乘积

样本点	$1$	$2$	$3$	$4$	$5$	$6$	$7$	$8$	$9$	$10$
$D$	$1$	$2$	$2$	$3$	$2$	$4$	$2$	$4$	$3$	$4$
$F$	$0$	$1$	$1$	$1$	$1$	$2$	$1$	$1$	$1$	$2$

样本点	$1$	$2$	$3$	$4$	$5$	$6$	$7$	$8$	$9$	$10$
$D$	$1$	$2$	$2$	$3$	$2$	$4$	$2$	$4$	$3$	$4$
$F$	$0$	$1$	$1$	$1$	$1$	$2$	$1$	$1$	$1$	$2$

样本点	$1$	$2$	$3$	$4$	$5$	$6$	$7$	$8$	$9$	$10$
$D$	$1$	$2$	$2$	$3$	$2$	$4$	$2$	$4$	$3$	$4$
$F$	$0$	$1$	$1$	$1$	$1$	$2$	$1$	$1$	$1$	$2$