上一节我们引入的随机变量的数学期望 (均值), 反映出随机变量的取值的平均值这样一个特征. 除此之外, 现实问题中人们还关心随机变量取值的分散程度或波动性.
比如某水泥厂的一台打包机装一袋水泥的重量 (单位为 kg ) 在 [50−0.5,50+0.5] 之间均匀分布,而另一台打包机装一袋水泥的重量 (单位为 kg ) 在 [50−1.5,50+1.5] 之间均匀分布. 虽然两台打包机装一袋水泥的重量的均值都是 50, 但后者打出的一袋重量分散程度 (波动性) 较大.
本节引入的方差就反映随机变量取值的分散程度 (波动性) 的特征.
因为方差反映随机变量取值的波动性, 所以我们自然想到它取值相对于其均值的差别的大小. 所以有定义 4.1.3.
定义 4.1.3
设随机变量 X 有有限的数学期望, 如果 E[(X−E[X])2]<∞, 则称
Var[X]=E[(X−E[X])2](4.1.6)
为 X 的方差.
而称 Var[X] 为 X 的标准差,记为 σ[X].
可见, 方差就是随机变量与其均值差的平方的平均值, 而标准差的引入是因为其量纲与 X 的量纲相一致,从而更好解释实际问题.
借助公式 (4.1.2) 和 (4.1.4), 如果随机变量的方差存在, 我们有如下计算公式:
(1) 对于具有概率分布为 P(X=xi)=pi,i=1,2,⋯ 的离散型随机变量 X,
Var[X]=i=1∑∞(xi−E[X])2pi.(4.1.7)
(2)对于具有分布密度函数 fX 的连续型随机变量 X,
Var[X]=∫−∞∞(x−E[X])2fX(x)dx.(4.1.8)
由求和运算和积分运算的线性性, 显然有
Var[X]=E[X2]−(E[X])2.(4.1.9)
事实上, 若按 (4.1.7), 我们有
Var[X]=i=1∑∞(xi−E[X])2pi,=i=1∑∞(xi2−2E[X]⋅xi+(E[X])2)pi,=i=1∑∞xi2pi−2E[X]i=1∑∞xipi+(E[X])2i=1∑∞pi,=E[X2]−2E[X]⋅E[X]+(E[X])2,=E[X2]−(E[X])2.
请读者按 (4.1.8) 证明 (4.1.9). 有时利用 (4.1.9) 计算方差比较方便.
例 4.1.9
设 X∼B(1,p),试求 Var[X].
解
由于 P(X=1)=p,P(X=0)=1−p,所以
E[X]=1⋅p+0⋅(1−p)=p,
E[X2]=12⋅p+02⋅(1−p)=p.
进而用 (4.1.9) 得
Var[X]=p−p2=p(1−p).
例 4.1.10
设 X∼U[a,b],试求 Var[X].
解
由例 4.1.4 知 E[X]=2a+b,而
E[X2]=∫abx2b−a1dx=31(a2+ab+b2),
所以, 用 (4.1.9) 得
Var[X]=31(a2+ab+b2)−(2a+b)2=12(b−a)2.
例 4.1.11
设 X∼Exp(λ),试求 Var[X].
解
由例 4.1.6 知, E[X]=λ1,而
E[X2]=∫0∞x2λe−λxdx=λ21∫0∞y2e−ydy(参见例 4.1.6)=λ21Γ(3)(参见例 4.1.6)=λ22(参见例 4.1.6),
所以, 用 (4.1.9) 得
Var[X]=λ22−(λ1)2=λ21.
例 4.1.12
设 X∼Pois(λ),试求 Var[X].
解
由例 4.1.2 知 E[X]=λ,而
E[X2]=k=0∑∞k2k!e−λλk=k=1∑∞k2k!e−λλk=k=1∑∞(k(k−1)+k)k!e−λλk=k=2∑∞k(k−1)k!e−λλk+k=1∑∞kk!e−λλk=λ2e−λk=2∑∞(k−2)!λk−2+λ(参见例 4.1.2)=λ2+λ.
所以, 用 (4.1.9) 得
Var[X]=(λ2+λ)−λ2=λ
例 4.1.13
设 X∼N(μ,σ2),试求 Var[X].
解
例 4.1.5 知 E[X]=μ,由 (4.1.8) 有
Var[X]=∫−∞∞(x−μ)22πσ1e−2σ2(x−μ)2dx=σ22π1∫−∞∞y2e−2y2dy(变数替换 y=σx−μ)=σ22π1∫−∞∞(−y)d(e−2y2)=σ22π1(−ye−2y2)−∞∞+σ22π1∫−∞∞e−2y2dy=σ2.
可见, X 的分布参数 σ2 为其方差. 因为方差越大, X 取值的分散程度就越大,这与我们在 2.3.3 节中所述的相一致,即 σ 越小则正态曲线越陡峭, σ 越大则止态曲线越平缓.