第四章 随机变量的数字特征
对于一个随机变量 (随机向量), 如果知道了它的分布函数 (离散型的知道分布列, 连续型的知道分布密度函数), 则它的统计特性就完全知道了. 但对于有些随机变量, 或者它的分布难以求得, 只能得到某些比较片面的信息, 或者即使知道了其分布但我们关心的信息却不太明确. 例如, 比较两个班某科统考的成绩. 知道了每个同学的成绩, 却难以看出区别. 这时可利用一些数字特征, 比如各班的平均成绩、各班的最高分和最低分、各班的最高分与最低分的差距等, 来判断和分析两个班成绩的好坏.
4.1 一维随机变量的数字特征
本节我们介绍随机变量的数学期望、方差和矩等数字特征. 顾名思义, 数字特征就是用一个数值反映随机变量某方面的特性.
4.1.1 随机变量的数学期望
随机变量的数学期望又称均值. 我们知道, 随机变量的取值随着试验结果的不同而可能取不同的值, 并且取各值的概率不尽相同, 那么它的平均取值是多少呢?
1. 离散型随机变量的数学期望
我们先从离散型随机变量的一个例子入手来分析. 例如, 一位射手的水平用打出的环数来记, 其分布列为
我们想用一个数来刻画该射手的平均环数. 由于他打出各环数的概率不同, 显然不能用 1 到 10 的算术平均值来计算, 而应考虑他打出环数的概率. 根据概率的统计定义,我们可以认为,他射击 100 次,打出 1 环的次数近乎 1 次,打出 2 环的次数近乎 2 次,打出 3 环的次数近乎 5 次, ,打出 10 环的次数近乎 10 次.
所以射击 100 次的平均环数近似地为
由此看来, 以下关于离散型随机变量的数学期望的定义是合理的.
定义 4.1.1 设离散型随机变量 的概率分布列 . 若级数 收敛,则称 数学期望存在,并称
为 的数学期望 (或均值),简称为 的期望.
此定义中要求级数 绝对收敛是因为 等数字的平均值应与其排列的次序无关.
对于离散型随机变量的函数的数学期望, 容易得到下面的结论.
设离散型随机变量 的概率分布为 为实变量的实值函数,且 收敛,则
公式 (4.1.2) 告诉我们,为要计算 ,无需先求得 的分布列.
下面我们通过例子计算几类重要离散型随机变量的数学期望.
例 4.1.1 设 ,试求 .
解
这说明 重独立伯努利试验中成功的平均次数为 .
例 4.1.2 设 ,试求 .
解
这说明泊松分布的参数 恰是服从该分布的随机变量取值的平均值.
例 4.1.3 设 的概率分布为
试求 和 .
解 .
2. 连续型随机变量的数学期望
设连续型随机变量 的分布密度函数为 ,则对任 有
所以,设想将 划分成若干个不相交的有限区间 取值在每个区间上的概率约为 ,此时模仿 (4.1.1) 的定义, 的数学期望应为
再使划分越来越细, 的数学期望应为
于是我们有定义 4.1.2.
定义 4.1.2 设连续型随机变量 的分布密度函数为 . 如果
则称
为 的数学期望 (或均值),简称为 的期望.
与离散型随机变量的情形类似,若 为实变量的实值函数,且
则可以证明 (需要较深的数学知识),
公式 (4.1.4) 告诉我们,要计算 ,无需先求得 的分布密度函数.
下面作为例子, 我们计算几类重要连续型分布的数学期望.
例 4.1.4 设 ,试求 .
解 由于 的分布密度函数为
所以, 由 (4.1.3) 有
可见, 的均值位于区间 的中点,这与我们的直观想法一致,即 的取值随试验结果的不同,有时大于 ,有时小于 . 但因为分布是均匀的, 其平均取值应为区间 的中点 .
例 4.1.5 设 ,试求 .
解 由于 的分布密度函数为
所以, 由 (4.1.3) 有
可见, 的均值为其分布参数 . 由于 是 图像的对称轴,所以这个结果直观上是显然的.
例 4.1.6 设 ,试求 .
解 由于 的分布密度函数为
所以, 由 (4.1.3) 有
可见, 的均值为其分布参数 的倒数.
例 4.1.7 设 服从标准柯西分布,即
试问 的数学期望是否存在?
解 由于
可见, 的数学期望不存在. 其实,熟悉积分收敛性判别的读者,立即可以看出 (4.1.5) 左端的积分不收敛, 从而可省去以上计算.
例 4.1.8 设 . 试求 .
解 由 (4.1.4) 有
从例 4.1.8 中读者可以看出公式 (4.1.4) 的重要性. 因为在这里 的分布密度函数 不易求得,于是通过 求 就很麻烦.
4.1.2 随机变量的方差
上一节我们引入的随机变量的数学期望 (均值), 反映出随机变量的取值的平均值这样一个特征. 除此之外, 现实问题中人们还关心随机变量取值的分散程度或波动性. 比如某水泥厂的一台打包机装一袋水泥的重量 (单位为 ) 在 之间均匀分布,而另一台打包机装一袋水泥的重量 (单位为 ) 在 之间均匀分布. 虽然两台打包机装一袋水泥的重量的均值都是 50, 但后者打出的一袋重量分散程度 (波动性) 较大. 本节引入的方差就反映随机变量取值的分散程度 (波动性) 的特征.
因为方差反映随机变量取值的波动性, 所以我们自然想到它取值相对于其均值的差别的大小. 所以有定义 4.1.3.
定义 4.1.3 设随机变量 有有限的数学期望,如果 , 则称
为 的方差. 而称 为 的标准差,记为 .
可见, 方差就是随机变量与其均值差的平方的平均值, 而标准差的引入是因为其量纲与 的量纲相一致,从而更好解释实际问题.
借助公式 (4.1.2) 和 (4.1.4), 如果随机变量的方差存在, 我们有如下计算公式:
(1) 对于具有概率分布为 的离散型随机变量 ,
(2)对于具有分布密度函数 的连续型随机变量 ,
由求和运算和积分运算的线性性, 显然有
事实上, 若按 (4.1.7), 我们有
请读者按 (4.1.8) 证明 (4.1.9). 有时利用 (4.1.9) 计算方差比较方便.
例 4.1.9 设 ,试求 .
解 由于 ,所以
进而用 (4.1.9) 得
例 4.1.10 设 ,试求 .
解 由例 4.1.4 知 ,而
所以, 用 (4.1.9) 得
例 4.1.11 设 ,试求 .
解 由例 4.1.6 知, ,而
所以, 用 (4.1.9) 得
例 4.1.12 设 ,试求 .
解 由例 4.1.2 知 ,而
所以, 用 (4.1.9) 得
例 4.1.13 设 ,试求 .
解 例 4.1.5 知 ,由 (4.1.8) 有
可见, 的分布参数 为其方差. 因为方差越大, 取值的分散程度就越大,这与我们在 2.3.3 节中所述的相一致,即 越小则正态曲线越陡峭, 越大则止态曲线越平缓.
4.1.3 随机变量的矩
刻画随机变量的分布特性的另一类数字特征就是随机变量的矩. 我们这里做简单介绍.
则称 定义 4.1.4 设 为随机变量, 为常数, 为正整数,如果 ,
为 关于点 的 阶矩.
当 时,称 为 的 阶原点矩.
当 时,称 为 的 阶中心矩.
由定义 (4.1.4) 看出, 的均值就是 的 1 阶原点矩, 的方差就是 的 2 阶中心矩.
由 2 阶、3 阶和 4 阶中心矩可以定义两种刻画随机变量分布特性的常用的数字特征, 它们是偏度和峰度.
定义 4.1.5 设 为随机变量,如果 ,则称
为 的偏度. 而称
为 的峰度.
顾名思义,偏度是刻画 的分布的偏斜程度. 如果 的分布关于 对称. 显然 3 阶矩 ,从而偏度为 0. 如果 0,则 的分布取值大于 的概率较大,此时称 的分布为右偏. 如果 ,则称 的分布为左偏. (4.1.11) 中除以 则是为了标准化, 以消除因尺度选择不同所造成的影响.
显然, 正态分布的偏度为 0.
峰度则反映 的分布 (密度) 在其均值附近的陡峭程度. 若 的取值比较集中于 附近,则峰度较小,否则就比较大. 在 (4.1.12) 中分母出现 也是为了消除尺度的影响而标准化的.
若 ,经计算可知 ,此时 的峰度系数为 3. 通常若一个随机变量的峰度系数大于 3, 则称为尖峰的.
4.2 随机向量的数字特征
上一节中我们引入了单个随机变量的数字特征, 对于两个随机变量, 我们将引入刻画它们相关关系的数字特征, 即协方差和相关系数. 在此基础上, 将引入随机向量的数字特征, 即期望向量和协方差矩阵. 最后, 讨论期望和方差的运算性质.
4.2.1 二维随机向量的协方差
设(X, Y)为二维随机向量, 为定义在二维实平面上实值函数,如果 存在,可以证明下面类似于 (4.1.2) 和 (4.1.4) 的两个有用的公式.
(1) 设离散型随机变量(X, Y)有概率分布
,则
(2)设连续型随机变量(X, Y)有分布密度函数 ,则
特别地,取 ,则由 (4.2.1) 有
由 (4.2.2) 有
由 (4.2.3) 和 (4.2.4) 可见, 随机向量 (不仅限于二维随机向量) 的每个分量的期望都可用其联合概率分布列或联合分布密度函数计算得到, 这一点我们将在讨论期望和方差的运算性质时用到. 下面我们先引入协方差和相关系数的概念.
(1) 称 定义 4.2.1 设(X, Y)为二维随机向量,且 .
为 与 的协方差.
(2) 称
为 与 的相关系数.
(3) 若 ,则称 与 不相关.
由 (4.2.5) 和 (4.2.1), 有
即
读者也可利用 (4.2.5) 和 (4.2.2) 证明 (4.2.7).
为说明协方差和相关系数的概率意义, 我们不加证明地给出定理 4.2.1.
定理 4.2.1 设(X, Y)为二维随机向量,且 .
(1) 若 与 独立,则 ,亦即 (此事实由 4.2.2 节中期望的性质 3 和 (4.2.7) 是显然的).
(2) .
(3) 若 ,则存在常数 和 ,使得
若 ,则存在常数 和 ,使得
定理 4.2.1 说明,相关系数反映 与 的相关程度. 若 ,我们称 与 正相关. 若 ,我们称 与 负相关. 但需要强调指出,相关系数只反映 与 线性相关的程度,而不能刻画 与 非线性关系 (参见例 4.2.1).
对于 . 经计算可得 . 这说明对于正态分布的随机向量 与 独立的充要条件是 与 不相关 (参见例 3.3.4), 这是正态分布所具有的独特的、非常重要的性质.
例 4.2.1 设 . 若令 ,则 与 有确定的非线性关系. 但是
这说明 与 不相关.
例 4.2.2 设(X, Y)的联合分布密度函数为
试求 和 .
解 .
对于随机向量 ,其期望定义为各分量的期望组成的数值向量, 而协方差则为两两分量的协方差构成的矩阵. 亦即如下的定义 4.2.2.
定义 4.2.2 设随机向量 的每个分量都有有限方差. 则定义
和
4.2.2 数学期望、方差和协方差的运算性质
微积分学中定义了数列的极限之后, 要讨论极限的运算性质, 从而使得求数列的和、积、商等的极限, 转化为求各数列极限的和、积、商的问题. 类似的情况也出现在求导数和求积分过程中. 本小节我们讨论期望和方差的运算性质. 利用这些性质可使求期望和方差的过程简化. 期望的运算性质主要是其线性性, 而方差的主要性质是, 当随机变量两两不相关时具有可加性.
(1)数学期望的运算性质
性质 1 任意常数 的数学期望等于 .
证明 将常数 看成随机变量,它取 的概率为 1,而不取其他值,由 (4.1.1) 即得.
本性质的直观意义是明显的,因为每次试验都取值 ,当然平均值为 .
性质 2 (线性性) 设随机变量 的数学期望都存在, 为常数,则
证明 不失一般性,只就连续型随机变量的情形加以证明. 设(X, Y)的联合分布密度为 ,由于 的数学期望都存在,所以
另外, 由积分的线性性知
性质 3 设随机变量 与 相互独立,且 和 的数学期望存在,则
证明 不失一般性,只就连续型随机变量的情形加以证明. 设(X, Y)的联合分布密度为 与 的分布密度函数分别为 和 . 由 与 相互
独立知
从而
由 (4.2.7) 可知,性质 3 中的独立性条件可弱化为 与 不相关.
例 4.2.3 设 ,试求 .
解 这个问题在例 4.1.1 中已有答案. 我们这里利用数学期望的线性性来计算. 由于 与 重独立伯努利试验中的 “成功” 次数同分布 (成功的概率为 ), 令
则 ,进而有 . 且
所以由数学期望的线性性 (参见 (4.2.8)) 有
下面我们利用数学期望的运算性质来证明方差的运算性质.
(2)方差的运算性质
性质 1 任意常数 的方差为 0.
证明 由于 ,所以 .
本性质的直观意义是明显的,因为每次试验都取值 ,当然分散程度为 0. 反过来,可以证明,若 ,则存在常数 使得 .
性质 2 设随机变量 与 相互独立,且 与 的方差都存在, 为常数, 则
证明 由 与 相互独立和 (4.2.7) 以及期望的性质 3 知, . 再由数学期望的线性性, 我们有
由性质 2 的证明可见,其中的独立性条件可弱化为 与 不相关.
例 4.2.4 设 ,试求 .
解 沿用例 4.2.3 的有关记号, . 由试验的独立性知, 相互独立,且
所以由方差的性质 2 有
(3) 协方差的运算性质
协方差的运算性质是其对称性和双线性性.
性质 1 (对称性) 设随机变量 和 的方差都存在,则
由协方差的定义, 这个性质是显然的.
性质 2 (双线性性) 设随机变量 和 的方差都存在, 为常数,则有
和
这个性质由协方差的对称性以及
即得.
4.2.3 条件数学期望
条件数学期望是研究不独立随机变量的重要工具. 这里仅对离散型和连续型随机变量的条件数学期望作简单介绍.
简单地讲, 条件数学期望就是关于条件分布求数学期望.
设(X, Y)为二维离散型随机向量,有有限的数学期望. 在 发生的条件下, 的条件数学期望 (简称为条件期望),就是在条件分布
下求数学期望, 即
在 发生的条件下, 的条件数学期望,就是在条件分布列
下求数学期望, 即
设(X, Y)为二维连续型随机向量,有有限的数学期望. 在 发生的条件下, 的条件数学期望,就是在条件分布密度函数 下求数学期望, 即
在 发生的条件下, 的条件数学期望,就是在条件分布密度函数 下求数学期望,即
从 (4.2.14)-(4.2.17) 的定义式中,我们看到 和 分别为 和 的函数. 比如在 中,就与 的取值有关,条件期望值随 的取值而变化.
另外,由于随机变量 与 相互独立时,条件分布与各自的边缘分布相同. 所以此时条件期望等于无条件期望,即 .
容易证明,
这是两个非常重要的公式, 它们对应于全概率公式 (参见定理 1.3.2).
为帮助读者理解 (4.2.18) 中 的含义,我们就离散型随机变量的情形来证明 .
事实上,由于 是 的函数,则由随机变量函数的期望的计算公式 (4.1.2) 和 (4.2.14) 有
请读者对连续型随机变量的情形,用公式 (4.1.4) 和 (4.2.17) 证明 .
因为条件数学期望是研究非独立随机变量基本工具之一, 我们通过一个例子来体会其应用.
例 4.2.5 (随机个随机变量的和) 设 为独立同分布随机变量序列,数学期望为 为非负整数值随机变量,数学期望存在,且与 独立,试求 .
解
另外,由 (3.3.6) 和 (3.3.7) 我们看到,若 (参见例 3.3.4), 则
即 和 分别为 和 的线性函数,这是正态分布的很独特的性质之一.
第四章小结与注记
(1) 我们知道, 对于随机变量 (包括一维和多维), 只要知道了分布函数 (或联合分布函数, 离散型的概率分布和连续型的分布密度函数), 它的统计特性就完全知晓了. 但现实问题中, 随机变量的分布难以求得, 想把握随机变量取值的某一方面的特征, 往往用一个数字来记这就是的随机变量的 “数字特征”.
(2)对于单个随机变量,主要的数字特征是数学期望 (又称均值) 和方差 (或标准差), 它们分别刻画随机变量取值的平均值和分散程度 (或称波动性). 在数理统计 (或较深的课程随机过程论) 中它们往往是以参数的形式出现的, 但我们也希望知道它们. 峰度和偏度等数字特征在实际问题的刻画中也时常用到.
(3) 对于随机向量, 主要的数字特征是两个随机变量间的协方差 (或相关系数), 它刻画两个随机变量之间的线性关系的紧密程度. 正如, 我们所强调的, 它仅仅反映二者的线性相关的程度, 而不反映非线性相关的程度.
至于随机向量的期望自然地定义为各分量期望构成的数值向量, 方差则指协方差矩阵.
(4)讨论期望 (算子) 和方差 (算子) 的运算性质, 可以为计算较为复杂的随机变量的期望和方差带来方便. 这里称二者为算子, 是因为期望和方差都把一个随机变量与一个数对应起来.
需要强调指出的是:
(4.1) 期望具有线性性 (参见 (4.2.8)).
(4.2) 协方差具有双线性性 (参见 (4.2.12) 及 (4.2.13)).
(4.3) 当 与 不相关 (或更强: 相互独立) 时,期望具有乘积性质 (参见 (4.2.9)), 方差具有可加性 (参见 (4.2.10)).
(5) 条件数学期望是研究相依 (不独立) 随机变量的重要工具之一, 我们这里只就离散型和连续型随机变量的情形作了简单介绍. 对于一般随机变量的情形, 条件数学期望的定义需要更为高深的数学知识 (特别是测度论知识), 才能解释清楚.
第四章习题
4.1. 设二维随机变量(X, Y)的联合概率分布为
0 | 1 | |
0 | $\frac{9}{25}$ | $\frac{6}{25}$ |
1 | $\frac{4}{25}$ | $\frac{6}{25}$ |
试求 .
4.2. 设随机变量 的分布密度函数为
求随机变量 的期望 .
4.3. 假设机器在一天内发生故障的概率为 0.2, 机器发生故障时全天停止工作. 若一周 5 个工作日里无故障, 可获利 10 万元, 发生一次故障仍可获利 5 万元, 发生二次故障则获利为 0, 发生三次或三次以上故障就要亏损 2 万元. 试问一周内平均获利是多少?
4.4. 设随机变量 服从参数为 0.5 的泊松分布,试求随机变量 的数学期望 .
4.5. 设二维连续型随机变量(X, Y)的分布密度函数为
求 (1) 的数学期望. (2) 的数学期望. (3) 的数学期望.
4.6. 现有 3 个袋子,各装有 个白球和 个黑球,先从第 1 个袋子中摸出一球,记下颜色后把它放入第 2 个袋子中, 再从第 2 袋子中摸出一球, 记下颜色后把它放入第 3 个袋子中, 最后从第 3 个袋子中摸出一球,记下颜色,记这 3 次摸球中所得的白球总数为 ,求 .
4.7. 设随机变量 的分布列为求随机变量 的方差.
$X$ | 1 | 5 | |
$P$ | 0.6 | 0.2 |
4.8. 设随机变量 的分布密度函数为
求随机变量 的方差.
4.9. 已知随机变量 的分布密度函数为
试求: (1) 随机变量 的数学期望、方差和标准差. (2) .
4.10. 设随机变量(X, Y)的联合概率分布为
$Y$ $X$ | -1 | 0 | 1 |
-2 | $a$ | 0 | 0 |
-1 | 0.14 | $b$ | 0 |
1 | 0.12 | 0.16 | 0.32 |
已知 ,求: (1) . (2) . (3) .
4.11. 设随机变量 的分布列为
$X$ | -2 | 0 | 6 |
$P$ | 0.2 | 0.4 | 0.4 |
求随机变量 的偏度.
4.12. 已知随机变量 的分布密度函数为
试求 的峰度.
值. 4.13. 已知 ,相关系数 ,求 之
4.14. 设二维随机变量(X, Y)的分布密度函数为
(1) 证明: . (2) 判断 与 是否独立.
4.15. 设随机变量 独立同分布,且 的分布列为: ,求 的数学期望.
4.16. 若(X, Y)服从二元正态分布 ,试求 的数字期望 与方差 .
4.17. 设(X, Y)的联合概率分布为
$Y$ $X$ | 0 | 1 |
0 | 0.1 | $a$ |
1 | $b$ | 0.4 |
已知 ,试求 (1) 之值. (2) .
4.18. 设二维随机变量(X, Y)的联合概率分布列为
$Y$ $X$ | -1 | 0 | 1 |
0 | 0.07 | 0.18 | 0.15 |
1 | 0.08 | 0.32 | 0.20 |
(1) 计算 . (2) 计算 与 的相关系数. (3) 判断 与 是否独立.
4.19. 设二维随机变量(X, Y)的联合概率分布列为
$Y$ $X$ | 01 |
0 | $\frac{9}{25}$$\frac{6}{25}$ |
1 | $\frac{4}{25}$$\frac{6}{25}$ |
试求 与 的协方差.
4.20. 设二维随机变量(X, Y)的联合概率分布列为
$Y$ $X$ | -1 | 0 | 1 |
-1 | 0 | $\frac{1}{8}$ | 0 |
0 | $\frac{1}{8}$ | 0 | $\frac{1}{4}\frac{1}{1}$ |
1 | $\frac{1}{4}$ |
计算条件期望 .
4.21. 设二维连续型随机变量(X, Y)的分布密度函数为
给定 ,求 的条件数学期望 .
4.22. 袋中有红、白、黑三种颜色球若干, 若从袋中任摸一球, 摸出的球为红球的概率为 ,摸出的球为白球的概率为 . 现从袋中有放回地摸球 次,共摸出红球 次,摸出白球 次,试求 与 的相关系数 .
4.23. 电视台有一节目 “幸运观众有奖答题”: 有两类题目, 类题答对一题奖励 1000 元. 类题答对一题奖励 500 元. 答错无奖励,并带上前面得到的钱退出,答对后可继续答题,并假设节目可无限进行下去 (有无限的题目与时间),选择 类型题目分别由抛均匀硬币出现的正、反面决定. 已知某答题者 类题答对的概率都为 0.4,答错的概率都为 类题答对的概率都为 0.6, 答错的概率都为 0.4. 试求:
(1)该答题者答对题数的数学期望.
(2)该答题者得到奖励金额的数学期望.