二维随机变量
一、二维随机变量的定义
设$E$是一个随机变量,它的样本空间是$S={e}$,设$X=X(e)$和$Y=Y(e)$是定义在$S$上的随机变量,由它们构成一个向量$(X,Y)$叫做二维随机变量
二、分布函数的定义
设$(X,Y)$是二维随机变量,对于任意实数$x,y$,均存在二元函数$F(x,y)=P{(X\leq x)\cap (Y\leq y)}$记作$P{X\leq x,Y\leq y}$,故将$F(x,y)$称为二维随机变量$(X,Y)$的分布函数,或称为随机变量$X$和$Y$的联合分布函数
三、分布函数的性质
1. 单调不减
任意固定$y$,当$x_{2}>x_{1}$时,$F(x_{2},y)\geq F(x_{1},y)$;任意固定$x$,当$y_{2}>y_{1}$时,$F(x,y_{2})\geq F(x,y_{1})$
2. 规范性
$0\leq F(x,y)\leq1$,且$F(-\infty,y)=F(x,-\infty)=F(-\infty,-\infty)=0,F(+\infty,+\infty)=1$
3. 右连续
$F(x+0,y)=F(x,y),F(x,y+0)=F(x,y)$,即函数$F(x,y)$关于$x,y$均右连续
4. 非负性
对于任意的$x_{1}<x_{2},y_{1}<y_{2}$,不等式$F(x_{2},y_{2})-F(x_{2},y_{1})+F(x_{1},y_{1})-F(x_{1},y_{2})\geq 0$成立
推导:
$\begin{aligned}\quad&P{X\leq x_{2},Y\leq y_{2}}-P{X\leq x_{2},Y\leq y_{1}}+P{X\leq x_{1},Y\leq y_{1}}-P{X\leq x_{1},Y\leq y_{2}}\=&P{X\leq x_{2},y_{1}<Y\leq y_{2}}-P{X\leq x_{2},y_{1}<Y\leq y_{2}}\=&P{x_{1}<X\leq x_{2},y_{1}<Y\leq y_{2}}\end{aligned}$
四、二维离散型随机变量
1. 定义
如果二维随机变量$(X,Y)$全部可能取到的值是有限对或可列无限多对,则称$(X,Y)$是离散型的随机变量
2. 性质
-
非负性:$p_{ij}\geq 0$
-
规范性:$\sum\limits^{\infty}{i=1}\sum\limits^{\infty}{j=1}p_{ij}=1$
3. 联合分布律
$P{X=x_{i},Y=y_{j}}=p_{ij},\quad i,j=1,2,\cdots$为二维离散型随机变量$(X,Y)$联合分布律
例1:设随机变量$X$在$1,2,3,4$四个正数中等可能地取一个值,另一个随机变量$Y$在$1$到$X$中等可能地取一整数值,试求$(X,Y)$的分布律
$X$\ $Y$ | $1$ | $2$ | $3$ | $4$ |
---|---|---|---|---|
$1$ | $\frac{1}{4}$ | $0$ | $0$ | $0$ |
$2$ | $\frac{1}{8}$ | $\frac{1}{8}$ | $0$ | $0$ |
$3$ | $\frac{1}{12}$ | $\frac{1}{12}$ | $\frac{1}{12}$ | $0$ |
$4$ | $\frac{1}{16}$ | $\frac{1}{16}$ | $\frac{1}{16}$ | $\frac{1}{16}$ |
五、二维连续性随机变量
1. 定义
如果存在非负可积函数$f(x,y)$,使对于任意$x,y$都有$F(x,y)=\int^{y}{-\infty}\int^{x}{-\infty}f(u,v)dudv$,则称$(X,Y)$是连续型的二维随机变量,函数$f(x,y)$称为二维随机变量$(X,Y)$的概率密度,或者称为随机变量$X$和$Y$的联合概率密度
2. 性质
-
$f(x,y)\geq 0$
-
规范性:$\int^{+\infty}{-\infty}\int^{+\infty}{-\infty}f(x,y)dxdy=F(+\infty,+\infty)=1$
3. 求法
$P{(X,Y)\in D}=\iint_{(x,y)\in D}f(x,y)$
例2:设二维随机变量$(X,Y)$具有概率密度$f(x,y)=\begin{cases}2e^{-(2x+y)},x>0,y>0\0,\quad\text{其他}\end{cases}$,求
- 分布函数$F(x,y)$
$F(x,y)=\int^{x}{-\infty}du\int^{y}{-\infty}f(u,v)dv=\begin{cases}\int^{x}{0}du\int^{y}{0}2e^{-(2u+v)}dv=(1-e^{-2x})(1-e^{-y}),x>0,y>0\0,\quad\text{其他}\end{cases}$
- $P{Y\leq X}$的概率
$\begin{aligned}P{Y\leq X}&=\iint\limits_{y\leq x}f(x,y)dxdy\&=\int^{+\infty}{0}dx\int^{x}{0}2e^{-(2x+y)}dy\&=\frac{1}{3}\end{aligned}$
边缘分布
一、定义
1. 边缘分布函数
二维随机变量$(X,Y)$作为一个整体,具有分布函数$F(x,y)$,而$X$和$Y$都是随机变量,各自也有分布函数,将它们分别记为$F_{X}(x),F_{Y}(y)$,依次称为二维随机变量$(X,Y)$关于$X$和关于$Y$的边缘分布函数。边缘分布函数可以由$(X,Y)$的分布函数$F(x,y)$所确定
2. 边缘分布律
- $X$的边缘分布律
$P{X=x_{i}}=\sum\limits^{\infty}{j=1}p{ij},i=1,2,\cdots$。即第$i$行的概率和
推导:$P{X=x_{i}}=P{X=x_{i},\bigcup\limits_{j}Y=y_{i}}=\sum\limits^{n}{j=1}P{X=x{i},Y=y_{i}}$
- $Y$的边缘分布律
$P{Y=y_{i}}=\sum\limits^{\infty}{i=1}p{ij},j=1,2,\cdots$。即第$j$列的概率和
3. 边缘概率密度
- $X$的边缘概率密度
$F_{X}(x)=\int^{+\infty}_{-\infty}f(x,y)dy$
推导:
$F(x,+\infty)=\int^{x}{-\infty}\int^{+\infty}{-\infty}f(u,v)dvdu$
两侧同时对$x$求导,得上式
- $Y$的边缘概率密度
$F_{Y}(y)=\int^{+\infty}_{-\infty}f(x,y)dx$
例1:一整数$N$等可能地在$1,2,3,\cdots,10$十个值中取一个值,设$D=D(N)$是能整除$N$的正整数的个数,$F=F(N)$是能整除$N$的素数的个数(注:$1$不是素数),写出$D$和$F$的联合分布律,并求边缘分布律
样本点 | $1$ | $2$ | $3$ | $4$ | $5$ | $6$ | $7$ | $8$ | $9$ | $10$ |
---|---|---|---|---|---|---|---|---|---|---|
$D$ | $1$ | $2$ | $2$ | $3$ | $2$ | $4$ | $2$ | $4$ | $3$ | $4$ |
$F$ | $0$ | $1$ | $1$ | $1$ | $1$ | $2$ | $1$ | $1$ | $1$ | $2$ |
则$D={1,2,3,4},F={0,1,2}$
$F$\ $D$ | $1$ | $2$ | $3$ | $4$ | $P{F=j}$ |
---|---|---|---|---|---|
$0$ | $\frac{1}{10}$ | $0$ | $0$ | $0$ | $\frac{1}{10}$ |
$1$ | $0$ | $\frac{2}{5}$ | $\frac{1}{5}$ | $\frac{1}{10}$ | $\frac{7}{10}$ |
$2$ | $0$ | $0$ | $0$ | $\frac{2}{10}$ | $\frac{2}{10}$ |
$P{D=i}$ | $\frac{1}{10}$ | $\frac{4}{10}$ | $\frac{2}{10}$ | $\frac{3}{10}$ |
则边缘分布律为
$D$ | $1$ | $2$ | $3$ | $4$ |
---|---|---|---|---|
$P$ | $\frac{1}{10}$ | $\frac{2}{5}$ | $\frac{1}{5}$ | $\frac{3}{10}$ |
$F$ | $0$ | $1$ | $2$ |
---|---|---|---|
$P$ | $\frac{1}{10}$ | $\frac{7}{10}$ | $\frac{1}{5}$ |
例2:设随机变量$X$和$Y$具有联合概率密度$f(x,y)=\begin{cases}6,x^{2}\leq y\leq x\0,\quad \text{其他}\end{cases}$,求边缘概率密度$f_{X}(x)$和$f_{Y}(y)$
$f_X(x)=\int^{+\infty}{-\infty}f(x,y)dy=\begin{cases}\int^{x}{x^{2}}6dy=6(x-x^{2}),0<x<1\0,\quad\text{其他}\end{cases}$
$f_{Y}(y)=\int^{+\infty}{-\infty}f(x,y)dx=\begin{cases}\int^{\sqrt{y}}{y}6dx=6(\sqrt{y}-y),0<y<1\0,\quad\text{其他}\end{cases}$
条件分布
一、条件分布律的定义
设$(X,Y)$是二维分散型随机变量,对于固定的$j$,若$P{Y=y_{j}}>0$,则称$P{X=x_{i}|Y=y_{j}}=\frac{P{X=x_{i},Y=y_{j}}}{P{Y=y_{j}}}=\frac{p_{ij}}{p_{\cdot j}},i=1,2,\cdots$为在$Y=y_{j}$的条件下随机变量$X$的条件分布律。同样,对于固定的$i$,若$P{X=x_{i}}>0$,则称$P{Y=y_{j}|X=x_{i}}=\frac{P{X=x_{i},Y=y_{j}}}{P{X=x_{i}}}=\frac{p_{ij}}{p_{i\cdot }},j=1,2,\cdots$为在$X=x_{i}$的条件下随机变量$Y$的条件分布律。
即条件分布律=联合概率/边缘概率
二、条件概率密度的定义
设二维随机变量$(X,Y)$的概率密度为$f(x,y)$,$(X,Y)$关于$Y$的边缘概率密度为$f_{Y}(y)$,若对于固定的$y$,$f_{Y}(y)>0$,则称$\frac{f(x,y)}{f_{Y}(y)}$为在$Y=y$的条件下$X$的条件概率密度,记为$f_{X|Y}(x|y)=\frac{f(x,y)}{f_{Y}(y)}$。称$\int^{x}{-\infty}f{X|Y}(x|y)dx=\int^{x}{-\infty}\frac{f(x,y)}{f{Y}(y)}dx$为在$Y=y$的条件下$X$的条件分布函数,记为$P{X\leq x|Y=y}$或$F_{X|Y}(x|y)$。类似地,在$X=x$的条件下$Y$的概率密度为$\frac{f(x,y)}{f_{X}(x)}$,记为$f_{Y|X}(y|x)$;$X=x$的条件下$Y$的条件的条件分布函数为$\int^{y}{-\infty}\frac{f(x,y)}{f{X}(x)}dy$,记为$P{Y\leq y|X=x}$或$F_{Y|X}(y|x)$
三、两种重要的二维连续性随机变量
1. 均匀分布
设$G$是平面上的有界区域,其面积为$A$,若二维随机变量$(X,Y)$具有概率密度$f(x,y)=\begin{cases}\frac{1}{A},(x,y)\in G\0,\quad\text{其他}\end{cases}$,则称$(X,Y)$在$G$上服从均匀分布,记作$(X,Y)\sim U(G)$
2. 二维正态分布
若二维连续型随机变量$(X,Y)$的概率密度为$f(x,y)=\frac{1}{2\pi \sigma_{1}\sigma_{2}\sqrt{1-\rho^{2}}}e^{-\frac{1}{2(1-\rho^{2})}\Big[\frac{(x-\mu_{1})^{2}}{\sigma_{1}^{2}}-\frac{2\rho(x-\mu_{1})(y-\mu_{2})}{\sigma_{1}\sigma_{2}}+\frac{(y-\sigma_{2})^{2}}{\sigma_{2}^{2}}\Big]},-\infty<x<+\infty,-\infty<y<+\infty$,其中$\mu_{1},\mu_{2},\sigma_{1}>0,\sigma_{2}>0,-1<\rho<1$均为常数,则称$(X,Y)$服从参数为$\mu_{1},\mu_{2},\sigma_{1},\sigma_{2}$和$\rho$的二维正态分布,记作$(X,Y)\sim N(\mu_{1},\mu_{2};\sigma_{1}^{2},\sigma_{2}^{2};\rho)$
例1:设二维随机变量$(X,Y)$在圆域$x^{2}+y^{2}\leq1$上服从均匀分布,求条件概率密度$f_{X|Y}(x|y)$
$S=\pi$
$\therefore f(x,y)=\begin{cases}\frac{1}{\pi},x^{2}+y^{2}\leq1\0,\text{其他}\end{cases}$
$f_{Y}(y)=\int^{+\infty}{-\infty}f(x,y)dx=\begin{cases}\int^{\sqrt{1-y^{2}}}{-\sqrt{1-y^{2}}}\frac{1}{\pi}dx=\frac{2}{\pi}\sqrt{1-y^{2}},-1<y<1\0,\quad\text{其他}\end{cases}$
当$-1<y<1$时
$f_{X|Y}(x|y)=\frac{f(x,y)}{f_{Y}(y)}=\begin{cases}\frac{1}{2\sqrt{1-y^{2}}},-\sqrt{1-y^{2}}<x<\sqrt{1-y^{2}}\0,\quad\text{其他}\end{cases}$
例2:设$X\sim U(0,1)$,当观察到$X=x(0<x<1)$时,$Y$服从$(x,1)$上的均匀分布,求$Y$的概率密度$f_{Y}(y)$
$f_{X}(x)=\begin{cases}\frac{1}{1}=1,0<x<1\0,\quad\text{其他}\end{cases}$
$f_{Y|X}(y|x)=\begin{cases}\frac{1}{1-x},0<x<y<1\0,\quad\text{其他}\end{cases}$
则$f(x,y)=f_{X}(x)\cdot f_{Y|X}(y|x)=\begin{cases}\frac{1}{1-x},0<x<y<1\0,\quad\text{其他}\end{cases}$
则$f_{Y}(y)=\int^{+\infty}{-\infty}f(x,y)dx=\begin{cases}\int^{y}{0}\frac{1}{1-x}dx=-\ln(1-y),0<y<1\0,\quad\text{其他}\end{cases}$
四、随机变量的相互独立
1. 定义
若对于所有的$x,y$,均有$P{X\leq x,Y\leq y}=P{X\leq x}P{Y\leq y}$,即$F(x,y)=F_{X}(x)F_{Y}(y)$,则称随机变量$X$与$Y$是相互独立的
联合概率=边缘概率的乘积,即联合分布函数=边缘分布函数的乘积
2. 充要条件
- 设$(X,Y)$是连续型随机变量,则$X$和$Y$相互独立$\Leftrightarrow f(x,y)=f_{X}(x)f_{Y}(y)$
即联合概率密度=边缘概率密度乘积
- 设$(X,Y)$是离散型随机变量,则$X$和$Y$相互独立$\Leftrightarrow P{X=x_{i},Y=y_{j}}=P{X=x_{i}}P{Y=y_{i}}$
即联合概率=边缘概率乘积