§1. 点 估 计
知识要点
1. 点估计
设 θ 是总体 X 的未知参数,用统计量 θ=θ(X1,X2,⋯,Xn) 来估计 θ,称 θ 为 θ 的估计量. 对于样本的一组观察值 x1,x2,⋯,xn,代入 θ 的表达式中所得的具体数值称为 θ 的估计值. 这样的方法称为参数的点估计.
2. 矩估计
用样本矩去估计相应总体矩, 或者用样本矩的函数去估计总体矩的同一函数的估计方法就是矩估计.
设总体 X 的概率分布含有 m 个未知参数 θ1,θ2,⋯,θm,假定总体的 k 阶原点矩存在,记 μk= E(Xk)(k=1,2,⋯,m),Ak=n1i=1∑nXik 为样本 k 阶矩,令
μk(θ1,θ2,⋯,θm)=Ak(k=1,2,⋯,m),
则此方程组的解 (θ1,θ2,⋯,θm) 称为参数 (θ1,θ2,⋯,θm) 的矩估计量. 矩估计量的观察值称为矩估计值.
3. 最大似然估计 (极大似然估计)
(1)设总体 X 的概率分布为 p(x;θ) (当 X 为连续型时,其为概率密度函数,当 X 为商散型时,其为分布律), θ=(θ1,θ2,⋯,θm) 为未知参数, x1,⋯,xn 为样本观察值.
L(x1,⋯,xn,θ)=i=1∏np(xi;θ)=L(θ),
称为 θ 的似然函数.
( 2 )对给定的 x1,⋯,xn,使似然函数达到最大值的 θ(x1,⋯,xn) 称为 θ 的最大似然估计值, 相应地 θ(X1,⋯,Xn) 称为 θ 的最大似然估计量.
(3)最大似然估计的常用求解方法. 由于 lnL(θ) 与 L(θ) 有相同的最大值点,若 L(θ) 可导, 则可由方程组
∂θi∂lnL(θ1,θ2,⋯,θm)=0(i=1,2,⋯,m),
求出 θi 的最大似然估计量,需注意的是这一方法并不都是有效的,对于有些似然函数,其驻点或导数不存在, 这时应考虑其他方法求似然函数的最大值点.
基本题型
题型 1: 求矩估计
【1.1】设总体 X 的概率密度函数为
f(x;θ)={θxθ−1,0,0<x<1 其他 (θ>0)
求未知参数 θ 的矩估计量.
分析 根据求矩估计量的求解步骤,先求出 X 的数学期望,得到参数 θ 与期望的关系,然后由样本均值替换总体期望,即是 θ 的矩估计.
解 EX=∫−∞+∞x⋅f(x;θ)dx=∫01xθxθ−1dx=θ+1θ,
令 EX=Xˉ,则 θ=1−XˉXˉ,其中 Xˉ=n1i=1∑nXi,则 θ 即为参数 θ 的矩估计.
【1.2】设总体 X 的分布律为 P{X=x}=(1−p)x−1p,x=1,2,⋯,(X1,X2,⋯,Xn) 是来自总体 X 的样本,试求 p 的矩估计量.
分析 对离散型随机变量同样是从求其数学期望出发,得到参数和数学期望之间的关系, 用样本均值替代总体期望.
解 因为 X 服从几何分布,所以由几何分布的数字特征结论.
E(X)=p1,令 EX=Xˉ.
因此参数 p 的矩估计量 p=Xˉ1.
【1.3】设总体 X 在 [a,b] 上服从均匀分布, (X1,X2,⋯,Xn) 为其样本,样本均值 Xˉ,样本方差 S2,则 a,b 的矩估计 a=a,b=
解 由均匀分布的数字特征结论:
EX=2a+b,DX=12(b−a)2.
令 EX=Xˉ,DX=S2,解得
a=Xˉ−3S,b=Xˉ+3S,
即为 a,b 的矩估计.
点评 因为需要估计两个参数 a,b,所以应该构造两个方程: (1) 求出期望 EX 用 Xˉ 代替; ( 2 )求出方差 DX 用 S2 代替,也可以求出 E(X2) 用 A2=n1i=1∑nXi2 代替,这样结果变成
a=Xˉ−3B2,b=Xˉ+3B2,
其中 B2=n1i=1∑n(Xi−Xˉ)2 为二阶样本中心距.
【1.4】随机地取 8 只活塞环,测得它们的直径为 (单位:mm)
74.00174.00574.00374.00174.00073.99374.00674.002
试求总体均值 μ 及方差 σ2 的矩估计值,并求样本方差 S2.
解 由矩法估计知
{μ1=E(X)=μμ2=E(X2)=D(X)+[E(X)]2=σ2+μ2
令 {μ=A1σ2+μ2=A2,解之得
μ=A1=Xˉ=n1i=1∑nXi,
σ2=A2−A12=n1i=1∑nXi2−Xˉ2=n1i=1∑n(Xi−Xˉ)2.
由题中数据得 μΛ=74.001,σΛ2=6×10−6.
样本方差 s2=n−11i=1∑n(xi−xˉ)2=6.86×10−6.
题型2: 求最大似然估计
方法与技巧 求最大似然估计的一般步骤为:
(1)构造似然函数;
(2)求似然函数的最大值点,此即所求最大似然估计.
求最大似然估计的三种情形:
(1)解极大似然方程(组);
(2)利用定义 L(θ)=maxL(θ);
(3)按照极大似然的不变性.
【1.5】设总体 X 的概率密度为
f(x;λ)={λαxα−1e−λxα,0, 若 x>0 若 x≤0
其中 λ>0 是未知参数, α>0 是已知常数,根据来自总体 X 的简单随机样本 X1,X2,⋯,Xn,求 λ 的最大似然估计量 λ.
分析 求最大似然估计关键是要确定似然函数.
解 由已知条件可得似然函数为
L(x1,x2,⋯,xn;λ)=i=1∏nf(xi;λ)=(λα)ne−λi=1∑nxiαi=1∏nxiα−1.
当 xi>0 时, L>0,且有
lnL=nln(λα)+lni=1∏nxiα−1−λi=1∑nxiα,
根据对数似然方程
dλdlnL=λn−i=1∑nxiα=0,
解得 λ 的最大似然估计 λ=i=1∑nxiαn. 巴 236
则 λ 的最大似然估计量为 λ=i=1∑nXiαn.
【1.6】设某种元件的使用寿命 X 的概率密度为
f(x;θ)={2e−2(x−θ),0,x>θx≤θ
其中 θ>0 为未知参数,又设 x1,x2,⋯,xn 是 X 的一组样本观测值,求参数 θ 的最大似然估计值.
分析 多数情况下, 最大似然估计值可以由似然函数的驻点求得, 但是在有些情况下, 似然函数的驻点不存在, 此时, 可以通过参数的取值范围求最大似然估计.
解 由题意知, 似然函数为
L(θ)=L(x1,x2,⋯,xn;θ)=⎩⎨⎧2ne−2i=1∑n(xi−θ),0,xi>θ(i=1,2,⋯,n) 其他
当 xi>0 时, L(θ)>0,两边取对数
lnL(θ)=nln2−2i=1∑n(xi−θ),
因为 dθdlnL(θ)=2n>0,所以 L(θ) 单调增加.
由于 θ 要满足 θ<xi(i=1,2,⋯,n),所以当 θ 取 x1,x2,⋯,xn 中的最小值时, L(θ) 取最大值.
故 θ 的最大似然估计值为 θ=min(x1,x2,⋯,xn).
【1.7】设总体 X 的概率分布为
$X$ | 0 | 1 | 2 | 3 |
$p$ | ${\theta }^{2}$ | ${2\theta }\left( {1 - \theta }\right)$ | ${\theta }^{2}$ | $1 - {2\theta }$ |
其中 θ(0<θ<21) 是未知参数,利用总体 X 的如下样本值
3,1,3,0,3,1,2,3
求 θ 的矩估计值和最大似然估计值.
分析 矩估计用基本求解方法即可. 对于最大似然估计, 若似然函数出现多个驻点应该根据题意选择.
解 由离散型随机变量的期望公式
EX=0×θ2+1×2θ(1−θ)+2×θ2+3×(1−2θ)
=2θ−2θ2+2θ2+3−6θ=3−4θ,
令 EX=Xˉ,而由样本观测值可得
Xˉ=81(3+1+3+0+3+1+2+3)=81×16=2,
所以 θ 的矩估计值为
θ=41(3−Xˉ)=41(3−2)=41.
根据题意, 似然函数为
L(θ)=4θ6(1−θ)2(1−2θ)4,
两边取对数可得
lnL(θ)=ln4+6lnθ+2ln(1−θ)+4ln(1−2θ),
dθdlnL(θ)=θ6−1−θ2−1−2θ8=θ(1−θ)(1−2θ)24θ2−28θ+6,
令 dθdlnL(θ)=0,得 12θ2−14θ+3=0,解之得 θ=127−13 或 127+13.
因为已知 0<θ<21,故 θ=127−13.
因此 θ 的最大似然估计值为 θ=127−13.
【1.8】设总体 X 的概率密度为
f(x;θ)=⎩⎨⎧θ,1−θ,0,0<x<11≤x<2 其他
其中 θ 是未知参数 (0<θ<1).X1,X2,⋯,Xn 为来自总体 X 的简单随机样本,记 N 为样本值 x1,x2,⋯,xn 中小于 1 的个数. 求
(1) θ 的矩估计;
(2) θ 的最大似然估计.
解 (1) 由于
EX=∫−∞+∞xf(x;θ)dx=∫01θxdx+∫12(1−θ)xdx
=21θ+23(1−θ)=23−θ.
令 23−θ=Xˉ,解得 θ=23−Xˉ,所以参数 θ 的矩估计为 θ=23−Xˉ.
(2)似然函数为
L(θ)=i=1∏nf(xi;θ)=θN(1−θ)n−N,
取对数, 得
lnL(θ)=Nlnθ+(n−N)ln(1−θ),
两边对 θ 求导,得
dθdlnL(θ)=θN−1−θn−N.
令 dθdlnL(θ)=0,得 θ=nN,
所以 θ 的最大似然估计为 θ=nN.
【1.9】设 X∼N(μ,σ2),x1,x2,⋯,xn 为一组样本值,求参数 μ,σ2 的极大似然估计.
解 似然函数
L(μ,σ2)=i=1∏n2πσ1e2σ2(xi−μ)2=(2πσ)n1e2σ2∑(xi−μ)2,
两边取对数得
lnL(μ,σ2)=−2nln(2πσ2)−2σ21i=1∑n(xi−μ)2,
似然方程组为
⎩⎨⎧∂μ∂lnL=σ21(i=1∑nxi−nμ)=0,∂σ2∂lnL=−2σ2n+2(σ2)21i=1∑n(xi−μ)2=0.
由前一式解得 μ=n1i=1∑nxi=xˉ,代入后一式得 σ2=n1i=1∑n(xi−xˉ)2. 因此得 μ,σ2 的最大似然估计量为
μ=Xˉ,σ2=B2=n1i=1∑n(Xi−Xˉ)2.
它们与相应的矩估计量相同.
【1.10】设总体 X 在 [a,b] 上服从均匀分布, a,b 未知, x1,x2,⋯,xn 是一个样本值. 试求 a, b 的最大似然估计量.
解 记 x(1)=min(x1,x2,⋯,xn),x(n)=max(x1,x2,⋯,xn).X 的概率密度是
f(x;a,b)={b−a1,0,a≤x≤b 其他
由于 a≤x1,x2,⋯,xn≤b,等价于 a≤x(1),x(n)≤b. 似然函数为
L(a,b)=(b−a)n1,a≤x(1),b≥x(n),
于是对于满足条件 a≤x(1),b≥x(n) 的任意 a,b 有
L(a,b)=(b−a)n1≤(x(n)−x(1))n1,
即 L(a,b) 在 a=x(1),b=x(n) 时取到最大值 (x(n)−x(1))−n. 故 a,b 的最大似然估计值为
a=x(1)=min1≤i≤nnxi,b=x(n)=maxxi.
a,b 的最大似然估计量为 a=min1≤i≤nnXi,b=max1≤i≤nxXi.
【1.11】(1) 设 X1,X2,⋯,Xn 是来自概率密度为
f(x;θ)={θxθ−1,0,0<x<1 其他
的总体样本, θ 未知,求 U=e−θ1 的最大似然估计值.
(2)设 X1,X2,⋯,Xn 是来自正态总体 N(μ,1) 的样本. μ 未知,求 θ=P{X>2} 的最大似然估计值.
解 (1) 先求 θ 的最大似然估计. 似然函数为
L(θ)=i=1∏nθxiθ−1=θn(i=1∏nxi)θ−1,
lnL(θ)=nlnθ+(θ−1)ln(i=1∏nxi).
令
dθdlnL(θ)=θn+i=1∑nlnxi=0,
得 θ 的最大似然估计值为
θ=i=1∑nlnxi−n.
U=e−θ1 具有单调反函数,故由最大似然估计的不变性知 U 的最大似然估计值为
U=e−θ1=eni=1∑nlnxi.
( 2 )已知 μ 的最大似然估计为 μ=xˉ. 而 θ=P{X>2}=1−P{X≤2}=1−Φ(2−μ) 具有单调反函数. 由最大似然估计的不变性得 θ=P{X>2} 的最大似然估计值为
θ=1−Φ(2−μ)=1−Φ(2−xˉ).
点评 最大似然估计的不变性:
如果 θ 是 θ 的最大似然估计,则对 θ 的任一函数 g(θ),其最大似然估计为 g(θ).
§2. 估计量的评选标准
知识要点
1. 无偏性
设 X1,X2,⋯,Xn 为来自总体 X 的样本, θ 为 θ 的一个估计量,如果 E(θ)=θ 成立,则称估计量 θ 为参数 θ 的无偏估计.
2. 有效性
设 θ1、θ2 都为参数 θ 的无偏估计量,若 D(θ1)≤D(θ2),则称 θ1 比 θ2 有效.
特别地,若对于 θ 的任一无偏估计 θ,有
D(θ1)≤D(θ)
则称 θ1 是 θ 的最小方差无偏估计 (最佳无偏估计).
3. 一致性
设 θ 为未知参数 θ 的估计量,若对任意给定的 ε>0,都有
n→∞limP{θ−θ<ε}=1,
即 θ 依概率收敛于参数 θ,则 θ 称为 θ 的一致估计或相合估计.
基本题型
题型 1: 估计量的无偏性问题
【2.1】已知总体 X 的期望 EX=0,方差 DX=σ2,X1,⋯,Xn 为其简单样本,均值为 Xˉ,方差为 S2. 则 σ2 的无偏估计量为_____.
(A) nXˉ2+S2 (B) 21nXˉ2+21S2
(C) 31nXˉ2+S2 (D) 41nXˉ2+41S2
解 由于
EXˉ=EX=0,E(Xˉ2)=DXˉ+(EXˉ)2,DXˉ=nσ2,ES2=σ2,
所以
E(nXˉ2+S2)=n⋅nσ2+σ2=2σ2.
则 E(21nXˉ2+21S2)=σ2,故 21nXˉ2+21S2 为 σ2 无偏估计.
应选 (B).
【2.2】设 X1,X2,⋯,Xn 是取自总体的样本,为了估计总体方差 σ2,我们利用统计量
σ2=Ki=1∑n−1(Xi+1−Xi)2
则 K= _____时, σ2 是 σ2 的无偏估计量.
解 由题意 E(σ2)=σ2.
因为
E(Xi+1−Xi)2=D(Xi+1−Xi)+[E(Xi+1−Xi)]2
=(DXi+1+DXi)+(EXi+1−EXi)2=(σ2+σ2)+0=2σ2,
所以
E(σ2)=Ki=1∑n−1E(Xi+1−Xi)2=Ki=1∑n−12σ2=2K(n−1)σ2.
故 K=2(n−1)1.
【2.3】设样本 X1,X2,⋯,Xn 来自于参数为 λ 的泊松分布.
试证明 Xˉ 与 S2=n−11i=1∑n(Xi−Xˉ)2 都是 λ 的无偏估计,且对任一 a 值, 0≤a≤1,统计量 aXˉ+(1−a)S2 也是 λ 的无偏估计.
证 因为总体 X∼P(λ),故 E(X)=λ,D(X)=λ. 而
E(Xˉ)=E(X)=λ,E(S2)=D(X)=λ,
由无偏性定义, Xˉ 与 S2 都是 λ 的无偏估计.
当 0≤a≤1 时,
E[aXˉ+(1−a)S2]=aE(Xˉ)+(1−a)E(S2)=aλ+(1−a)λ=λ.
故 aXˉ+(1−a)S2 也是 λ 的无偏估计.
【2.4】已知总体 X 的概率密度为
f(x)={θ1e−θx,0,x>0x≤0
其中未知参数 θ>0. 设 X1,X2,⋯,Xn 为取自总体 X 的一个样本,
(1)求 θ 的最大似然估计量;
(2)试问该估计量是否为无偏估计量?说明理由.
解 (1) 设 x1,x2,⋯,xn 为相应于样本 X1,X2,⋯,Xn 的一个样本值,似然函数为
L(θ)=⎩⎨⎧θn1e−θ1i=1∑nxi,0,x1,x2,⋯,xn>0, 其他
当 x1,x2,⋯,xn>0 时,有
lnL(θ)=−nlnθ−θ1i=1∑nxi.
将上式对 θ 求导数并令其等于零,得
dθdlnL(θ)=−θn+θ21i=1∑nxi=0.
解得 θ 的最大似然估计值为 θ=n1i=1∑nxi=xˉ.
因此, θ 的最大似然估计量为 θ=Xˉ.
(2)由于
E(θ)=E(Xˉ)=E(n1i=1∑nXi)=n1i=1∑nE(Xi)=E(X),
而 X 服从指数分布, E(X)=θ,所以 E(θ)=θ,故 θ=Xˉ 为未知参数 θ 的无偏估计量.
【2.5】设总体 X 的概率密度为
f(x;θ)=⎩⎨⎧2θ1,2(1−θ)1,0,0<x<θθ≤x<1 其他
其中参数 θ(0<θ<1) 未知, X1,X2,⋯,Xn 是来自总体 X 的简单随机样本, Xˉ 是样本均值.
(1)求参数 θ 的矩估计量 θ;
(2)判断 4Xˉ2 是否为 θ2 的无偏估计量,并说明理由.
解 (1) EX=∫−∞+∞xf(x;θ)dx=∫0θ2θxdx+∫θ12(1−θ)xdx=41+2θ.
令 Xˉ=EX,即 Xˉ=41+2θ,得 θ 的矩估计量为
θ=2Xˉ−21.
(2)因为
E(4Xˉ2)=4EXˉ2=4[DXˉ+(EXˉ)2]
=4[n1DX+(41+21θ)2]=n4DX+41+θ+θ2,
又 DX≥0,θ>0,所以 E(4Xˉ2)>θ2,即 E(4Xˉ2)=θ2,
因此 4Xˉ2 不是 θ2 的无偏估计量.
题型2:估计量的有效性问题
【2.6】设总体 X∼N(μ,σ2),X1,X2,⋯,Xn 为来自总体 X 的样本,当用 2Xˉ−X1,Xˉ 及 21X1 +32X2−61X3 作为 μ 的估计时,最有效的是哪个估计量?
分析 先验证估计量是否是无偏估计量,再根据有效性的定义判断有效性.
解 由无偏性的定义
E(2Xˉ−X1)=2EXˉ−EX1=2μ−μ=μ,
EXˉ=μ,
E(21X1+32X2−61X3)=21μ+32μ−61μ=μ,
可知 2Xˉ−X1,Xˉ 与 21X1+32X2−61X3 均是 μ 的无偏估计量.
D(2Xˉ−X1)=D(n2i=1∑nXi−X1)=D[(n2−1)X1+n2i=2∑nXi]
=(n2−n)2DX1+(n2)2i=2∑nDXi
=n21[(2−n)2σ2+4(n−1)σ2]=σ2,
DXˉ=nσ2,
D(21X1+32X2−61X3)=(41DX1+94DX2+361DX3)=1813σ2.
经过比较可知 DXˉ 最小,因此 Xˉ 是最有效的估计量.
【2.7】设总体 X 的样本是 X1,X2,⋯,Xn,试证明:
(1) i=1∑naiXi(ai>0,i=1,2,⋯,n,i=1∑nai=1) 是 E(X) 的无偏估计量;
( 2 )在 E(X) 的所有形如 i=1∑naiXi 的无偏估计量中, Xˉ 为最有效的估计.
分析 证明估计量的有效性时, 需要证明不等式成立, 因此采用 Cauchy - Schwarz 公式是很有效的方法
证 (1) 根据无偏性估计的定义有
E(i=1∑naiXi)=i=1∑naiE(Xi)=E(X)i=1∑nai=E(X),
故 i=1∑naiXi 是 E(X) 的无偏估计量.
(2)由样本均值的性质可知
E(Xˉ)=n1Ei=1∑nXi=EX,
因此 Xˉ 也是 E(X) 的无偏估计量.
又由 Cauchy- Schwarz 不等式
(i=1∑nxiyi)2≤(i=1∑nxi2)(i=1∑nyi2),
令 xi=ai,yi=1,则
(i=1∑nai)2=1≤ni=1∑nai2,
故
D(Xˉ)=n1D(X)=n1D(X)(i=1∑nai)2
≤D(X)(i=1∑nai2)=i=1∑nD(aiXi)=D(i=1∑naiXi).
证毕.
点评 本题也可以用导数知识求 i=1∑nai2 的最小值,从而得出结论. 另外本题的结论可以记住并当作定理应用, 见下面例题.
【2.8】设 (X1,X2,X3) 是来自总体 X 的一个简单样本,则在下列 EX 的估计量中,最有效的估计量是( ).
(A) 41(X1+2X2+X3) (B) 31(X1+X2+X3)
(C) 51(X1+3X2+X3) (D) 51(2X1+2X2+X3)
解 可以将 4 个选项中统计量的方差求出,经比较,(B) 中统计量 Xˉ 的方差 3D(X) 为最小, 故最有效.
也可以直接利用上题的结论, 选择 (B).
题型 3:估计量的相合性(一致性)问题
方法与技巧 相合性的证明一般有两种方法:
方法一 利用定义证明, 往往需要结合大数定律;
方法二 利用定理证明, 结论如下:
设 θn 是 θ 的一个估计量,若
n→∞limE(θn)=θ,n→∞limD(θn)=0,
则 θn 是 θ 的相合估计.
【2.9】设 X1,X2,⋯,Xn 是取自正态总体 N(μ,σ2) 的样本,证明 S2 是 σ2 的一致估计.
证法一 由大数定律
n→∞limP{n1i=1∑nXi−μ<ε}=1,
所以 Xˉ 是 μ 的一致估计.
同理,因 X12,X22,⋯,Xn2 也独立同分布,故 n1i=1∑nXi2 是 E(X2) 的一致估计.
而
S2=n−11i=1∑n(Xi−Xˉ)2=n−1n(n1i=1∑nXi2−Xˉ2),
故当 n→∞ 时,
n−1n→1,n1i=1∑nXi2→PE(X2),Xˉ2→Pμ2,
即 S2→PE(X2)−μ2=σ2. 则 S2 是 σ2 的一致估计.
证法二 因为 E(S2)=σ2,D(S2)=n−12σ4,故
n→∞limE(S2)=σ2,n→∞limD(S2)=n→∞limn−12σ4=0,
由定理可知, S2 是 σ2 的一致估计.
§3. 区间估计
知识要点
1. 区间估计
设 θ 为总体的未知参数, θ1 和 θ2 均为估计量,若对于给定的 α(0<α<1),满足 P{θ1≤θ ≤θ2}=1−α,则称 [θ1,θ2] 为 θ 的置信度为 1−α 的置信区间. 通过构造一个置信区间对未知参数进行估计的方法称为区间估计.
2. 单个正态总体的区间估计
设 X1,X2,⋯,Xn 为来自 N(μ,σ2) 的样本,则
(1)当 σ2 已知时, μ 的置信度为 1−α 的置信区间为
[Xˉ−nσu2α,Xˉ+nσu2α].
(2)当 σ2 未知时, μ 的置信度为 1−α 的置信区间为
[Xˉ−nSt2α(n−1),Xˉ+nSt2α(n−1)].
(3)当 μ 已知时, σ2 的置信度为 1−α 的置信区间为
χ2α2(n)i=1∑n(Xi−μ)2,χ1−2α2(n)i=1∑n(Xi−μ)2.
(4)当 μ 未知时, σ2 的置信度为 1−α 的置信区间为
[χ2α2(n−1)(n−1)S2,χ1−2α2(n−1)(n−1)S2].
3. 双正态总体的区间估计
设 X∼N(μ1,σ12),X1,X2,⋯,Xn1 为其样本, Y∼N(μ2,σ22),Y1,Y2,⋯,Yn2 为其样本,且 X 与 Y 独立.
(1) σ12, σ22 都为已知: μ1−μ2 的 1−α 置信区间为
Xˉ−Yˉ−u2αn1σ12+n2σ22,Xˉ−Yˉ+u2αn1σ12+n2σ22.
(2) σ12, σ22 都未知: μ1−μ2 的 1−α 置信区间为
Xˉ−Yˉ−t2α(γ)n1S12+n2S22,Xˉ−Yˉ+t2α(γ)n1S12+n2S22.
其中 γ=n1−1(n1S12)2+n2−1(n2S22)2(n1S12+n2S22)2 (取整).
特殊情形:
① σ12,σ22 未知,但 n1,n2 较大时: μ1−μ2 的 1−α 置信区间为
Xˉ−Yˉ−u2αn1S12+n2S22,Xˉ−Yˉ+u2αn1S12+n2S22.
② σ12=σ22=σ2 未知: μ1−μ2 的 1−α 置信区间为
[Xˉ−Yˉ−t2αSwn11+n21,Xˉ−Yˉ+t2αSwn11+n21],
其中 Sw2=n1+n2−2(n1−1)S12+(n2−1)S22,t 分布为 t(n1+n2−2).
(3) μ1,μ2 已知: σ22σ12 的 1−α 置信区间为
n21j=1∑n2(Yj−μ2)2n11i=1∑n1(Xi−μ1)2F1−2α(n2,n1),n21j=1∑n2(Yj−μ2)2n11i=1∑n1(Xi−μ1)2F2α(n2,n1).
(4) μ1,μ2 未知: σ22σ12 的 1−α 置信区间为
[S22S12F1−2α(i2−1,n1−1),S22S12F2α(n2−1,n1−1)].
4. (0−1) 分布参数的区间估计
设总体 X∼(0−1) 分布, P{X=1}=p,P{X=0}=1−p,X1,X2,⋯,Xn(n≥50) 为其样本,则 p 的 1−α 置信区间为
Xˉ−u2αnXˉ(1−Xˉ),Xˉ+u2αnXˉ(1−Xˉ).
5. 单侧置信区间
设 θ 为总体的未知参数,对于给定值 α(0<α<1),若 P{θ≥θ}=1−α,则称 [θ,+∞) 为 θ 的满足置信度 1−α 的单侧置信区间, θ 称为单侧置信下限. 若 P{θ≤θˉ}=1−α,则称 (−∞,θˉ] 为 θ 的满足置信度 1−α 的单侧置信区间, θˉ 称为单侧置信上限.
例如,对于正态分布 N(μ,σ2),σ2 未知,可得 μ 的置信水平为 1−α 的单侧置信区间为
① (−∞,Xˉ+tα(n−1)nS),单侧置信上限为 μˉ=Xˉ+tα(n−1)nS.
② (Xˉ−tα(n−1)nS,+∞),单侧置信下限为 μ=Xˉ−tα(n−1)nS.
也即只需将双侧置信区间的上下限中的“ 2α ” 改成“ α ”,就得到相应的单侧置信上下限了.
基本题型
方法与技巧 求未知参数的置信区间是区间估计的基本内容, 常用方法如下:
(1)一般方法
① 寻求一个样本 X1,X2,⋯,Xn 的函数 (枢轴变量)
W=W(X1,X2,⋯,Xn;θ)
它包含待估参数 θ,而不含其他未知参数,并且 W 的分布已知且不依赖于任何未知参数(当然不依赖于待估参数 θ );
② 对于给定的置信水平 1−α,定出两个常数 a,b,使
P{a<W(X1,X2,⋯,Xn;θ)<b}=1−α;
③ 若能从 a<W(X1,X2,⋯,Xn;θ)<b 得到等价的不等式 θ<θ<θˉ,其中
θ=θ(X1,X2,⋯,Xn),θˉ=θˉ(X1,X2,⋯,Xn)
都是统计量,那么 (θ,θˉ) 就是 θ 的一个置信水平为 1−α 的置信区间.
函数 W(X1,X2,⋯,Xn;θ) 的构造,通常可以从 θ 的点估计着手考虑. 常用的正态总体参数的置信区间可以用上述步骤推得.
(2)正态总体参数的置信区间
利用一般方法推出了参数的置信区间公式, 针对具体题目, 可以分清类型, 代入公式计算.
(3)非正态总体参数的置信区间
情形比较复杂, 一般采用大样本, 利用中心极限定理近似视为正态分布, 借用正态总体的某些特殊结论.
题型 1: 正态总体参数 μ 的区间估计
【3.1】设由来自正态总体 X∼N(μ,0.92) 容量为 9 的简单随机样本,得样本均值 Xˉ=5,则未知参数 μ 的置信度为 0.95 的置信区间是_____.
分析 本题是一个正态总体在方差已知的情况下求期望值 μ 的置信区间的问题,由公式
[Xˉ−nσu2α,Xˉ+nσu2α]
求解该置信区间.
解 由置信度 1−α=0.95 可得 α=0.05.
查 N(0,1) 分布表得到 u0.025=1.96.
代入 Xˉ=5,n=9,σ=0.9 得
[5−90.9×1.96,5+90.9×1.96],
因此参数 μ 置信度 0.95 的置信区间为 [4.412,5.588].
【3.2】设一批零件的长度服从正态分布 N(μ,σ2),其中 μ,σ2 均未知,现从中随机抽取 16 个零件,测得样本均值 xˉ=20(cm),样本标准差 s=1(cm). 则 μ 的置信度为 0.90 的置信区间是 ( ).
(A) (20−41t0.05(16),20+41t0.05(16))
(B) (20−41t0.1(16),20+41t0.1(16))
(C) (20−41t0.05(15),20+41t0.05(15))
(D) (20−41t0.1(15),20+41t0.1(15))
解 经过分析本题属于在方差未知情况下求一个正态总体期望的置信区间, 其公式为
(Xˉ−nSt2α(n−1),Xˉ+nSt2α(n−1)).
根据题意 xˉ=20,s=1,n=16,2α=0.05,代入公式.
可知应选(C).
【3.3】设总体 X∼N(μ,σ2),已知 σ2. 则样本容量 n 至少为_____时,才能保证 μ 的置信度 1−α 的置信区间长度不大于 d.
解 因为 μ 的置信区间为
[Xˉ−u2αnσ,Xˉ+u2αnσ]
所以区间长度为 2u2αnσ,则 2u2αnσ≤d,故 n≥(d2u2ασ)2.
【3.4】从总体 X1∼N(μ1,25) 中取出一容量为 n1=10 的样本,其样本均值 Xˉ1=19.8; 从总体 X2∼N(μ2,36) 中取出容量为 n2=12 的样本,其样本均值 Xˉ2=24.0,已知两个样本之间相互独立,求 μ1−μ2 的 0.90 置信区间.
解 这是 σ12,σ22 都为已知时,求均值差的区间估计问题.
由于 1−α=0.90,故 2α=0.05,u2α=1.645,
又因为 n1=10,n2=12,σ12=25,σ22=36,所以
n1σ12+n2σ22=1025+1236=5.5=2.345,
Xˉ1−Xˉ2−u2αn1σ12+n2σ22=19.8−24.0−1.645×2.345
=−4.2−3.858=−8.06,
Xˉ1−Xˉ2+u2αn1σ12+n2σ22=−4.2+3.858=−0.34.
因此,所求的 μ1−μ2 的 0.90 置信区间为 [−8.06,−0.34].
【3.5】设有甲、乙两种安眠药,随机变量 X,Y 分别表示患者服用甲、乙药后睡眠时间的延长数,并假设 X∼N(μ1,σ2),Y∼N(μ2,σ2). 为比较两种药品的疗效,随机地从服用甲药的患者中选取 10 人,从服用乙药的患者中选取 10 人,分别测得睡眠延长时间的均值与方差: X=2.33,S12 =(1.9)2;Yˉ=0.75,S22=(28.9)2. 试求方差未知情况下 μ1−μ2 的 95% 置信区间.
解 两正态总体的方差未知但相等,小样本,取
T=Swn11+n21(Xˉ−Yˉ)−(μ1−μ2)∼t(n1+n2−2)(这里n1=n2=10),
P{∣T∣<t2α(18)}=1−α(α=0.05),
查得 t0.025(18)=2.101. 于是算得置信下限、上限分别为
(xˉ−yˉ)−t0.025(18)⋅Swn11+n21
=(2.33−0.75)−2.101×1836.1+28.9×102
=1.58−1.78=−0.20,
(xˉ−yˉ)+t0.025(18)⋅Swn11+n21=1.58+1.78=3.36.
从而得 μ1−μ2 的 95% 置信区间为 (−0.20,3.36).
【3.6】为研究正常成年男、女血液红细胞的平均数的差别, 检查某地正常成年男子 156 名, 正常成年女子 74 名,计算得男性红细胞平均数为 465.13 万 /mm3,样本标准差为 54.80 万 /mm3; 女子红细胞平均数为 422.16 万 /mm3,样本标准差为 49.20 万 /mm3. 试问能否以 95% 的把握判定男子血红细胞均值高于女子血红细胞均值?
解 设正常成年男女血红细胞数构成的两个总体为 X,Y,则 X∼N(μ1,σ12),Y∼N(μ2, σ22), X 与 Y 独立,由 1−α=0.95,得 α=0.05, u2α=1.96,又 n1=156,n2=74, xˉ=465.13, yˉ=422.16,s1=54.80,s2=49.20. 虽然 σ12,σ22 未知,但因为两组样本都属于大样本,故 σ12≈s12, σ22≈s22. 则 μ1−μ2 的置信限为: (Xˉ−Yˉ)±u2αn1S12+n2S22.
代入数值:
(xˉ−yˉ)−u2αn1s12+n2s22≈28.04,(xˉ−yˉ)+u2αn1s12+n2s22≈57.1,
因此, μ1−μ2 的 95 % 置信区间为 [28.04,57.1].
因置信下限 28.04>0,从而 μ1>μ2,所以有 95% 的把握判定男性血红细胞均值高于女性血红细胞均值.
题型2: 正态总体参数 σ2 的区间估计
【3.7】若在某学校中, 随机抽取 25 名同学测量身高数据, 假设所测身高近似服从正态分布, 算得平均高为 170cm,标准差为 12cm,试求该班学生身高标准差 σ 的 0.95 置信区间.
分析 根据题意分析,本题属于正态总体 μ 未知,求方差 σ2 的区间估计,其置信区间公式为
(χ2α2(n−1)(n−1)S2,χ1−2α2(n−1)(n−1)S2).
解 取统计量
χ2=σ2(n−1)S2∼χ2(n−1),
根据 P{χ2>χ2α2(n−1)}=P{χ2<χ1−2α2(n−1)}=2α.
经过查 χ2 分布表,得 χ1−2α2(n−1)=χ0.9752(24)=12.401,
χ2α2(n−1)=χ0.0252(24)=39.364,
因此参数 σ2 的置信度为 1−α=0.95 的置信区间为
(χ2α2(n−1)(n−1)S2,χ1−2α2(n−1)(n−1)S2)=(87.80,278.69),
故 σ 的 0.95 的置信区间为 (87.80,278.69)≈(9.34,16.69).
【3.8】冷抽铜丝的折断力服从正态分布. 从一批铜丝中任取 10 根,测试折断力,得数据(单位:kg)如下:
578,572,570,568,572,570,570,596,584,572
求方差 σ2 和标准差 σ 的 90% 的置信区间.
解 Xˉ=101(578+572+570+568+572+570+570+596+584+572)=575.2,
S2=10−11[(578−575.2)2+(572−575.2)2+(570−575.2)2+(568−575.2)2
+(572−575.2)2+(570−575.2)2+(570−575.2)2+(596−575.2)2
+(584−575.2)2+(572−575.2)2]
=75.73,
查 χ2 分布表得
χ2α2(9)=χ0.052(9)=16.919,χ1−2α2(9)=χ0.952(9)=3.325,
故
χ2α2(9)(n−1)S2=16.9199×75.73=40.28,χ1−2α2(9)(n−1)S2=3.3259×75.73=204.98,
于是得 σ2 的 90% 的置信区间为 [40.28,240.98].σ 的 90% 置信区间为 [6.35,14.32].
【3.9】两个正态总体 N(μ1,σ12)、N(μ2,σ22) 的参数均未知,分别从两个总体中抽取容量为 25 和 15 的两个独立样本,测得样本方差分别为 6.38,5.15,求 σ22σ12 的置信区间 (α=0.10).
解 n1=25,S12=6.38,n2=15,S22=5.15,α=0.10,2α=0.05,
查 F 分布表得
F0.05(24.14)=2.35,F0.05(14.24)=2.13,
而 S22S12=5.156.38≈1.24.
由置信区间公式得 σ22σ12 的 90% 置信区间为
(S22S12F0.95(14,24),S22S12F0.05(14,24))=(0.528,2.641).
【3. 10】设 X1,X2,⋯,Xn 是来自分布 N(μ,σ2) 的样本, μ 已知, σ 未知.
( 1 )验证 i=1∑nσ2(Xi−μ)2∼χ2(n). 利用这一结果构造 σ2 的置信水平为 1−α 的置信区间.
(2)设 μ=6.5,且有样本值7.5,2.0,12.1,8.8,9.4,7.3,1.9,2.8,7.0,7.3,试求 σ 的置信水平为 0.95 的置信区间.
解 (1) 因 Xi∼N(μ,σ2),故
σXi−μ∼N(0,1),i=1,2,⋯,n.
由 σX1−μ,σX2−μ,⋯,σXn−μ 相互独立,得
i=1∑n(σXi−μ)2∼χ2(n).
于是有
P{χ1−2α2(n)<i=1∑nσ2(Xi−μ)2<χ2α2(n)}=1−α,
即有
P⎩⎨⎧χ2α2(n)i=1∑n(Xi−μ)2<σ2<χ1−2α2(n)i=1∑n(Xi−μ)2⎭⎬⎫=1−α.
得 σ2 的置信水平为 1−α 的置信区间为
χ2α2(n)i=1∑n(Xi−μ)2,χ1−2α2(n)i=1∑n(Xi−μ)2.
(2)现在 n=10,μ=6.5,1−α=0.95,α=0.05,由样本值经计算得 i=1∑10(Xi−μ)2=102. 69,查表知, χ0.0252(10)=20.483,χ0.9752(10)=3.247.
于是 σ2 的置信水平为 0.95 的置信区间为 (5.013,31.626).σ 的置信水平为 0.95 的置信区间为 (2.239,5.624).
题型 3: 单侧置信限问题
【3.11】从一批电子元件中随机地抽取 10 只作寿命试验,其寿命 (以小时计) 如下:
1498149915011503150014991499149815001503
设寿命服从正态分布,试求其平均寿命的 95% 置信下限.
解 本例中,总体 X∼N(μ,σ2),且方差 σ2 未知,故应使用 t 分布. 因
S(Xˉ−μ)⋅n∼t(n−1),
此时要求
P{S(Xˉ−μ)n<tα(n−1)}=1−α,
于是得 μ 的置信度 1−α 单侧置信区间为
(Xˉ−tα(n−1)⋅nS,+∞).
对于给定的数据, 具体计算如下:
xˉ=101(1498+1499+1501+1503+1500+1499+1499+1498+1500+1503)=1500,
s2=10−11[(1498−1500)2+(1499−1500)2+(1501−1500)2
+(1503−1500)2+(1500−1500)2+(1499−1500)2+(1499−1500)2
+(1498−1500)2+(1500−1500)2+(1503−1500)2]
=310,
又
1−α=0.95,α=0.05,t0.05(10−1)=1.8331,
故寿命均值的 95% 单侧置信区间为
(1500−101×310×1.8331,+∞)≈(1498.942,+∞).
1498.942 就是所求的置信下限.
题型 4 : 非正态总体参数的区间估计
【3.12】在一大批产品中取 100 件,经检验有 92 件正品,若记这批产品的正品率为 p,求 p 的置信度 0.95 的置信区间.
解 本题中的正品率 p 就是 (0−1) 分布中的参数 p,而 n=100 属于大样本.
由 1−α=0.95 知 α=0.05,查得 u0.025=1.96,而样本中平均正品率 xˉ=10092,代入公式
pˉ=xˉ+u2αnx(1−x)=0.92+1.961000.92×0.08=0.97,
p=xˉ−u2αnx(1−x)=0.92−1.961000.92×0.08=0.87,
所以 p 的置信度 0.95 的置信区间为 (0.87,0.97).
【3.13】设总体 X 的方差 σ2=1,根据来自 X 的容量为 100 的简单样本,测得样本均值为 5, 则 X 的数学期望的置信度近似等于 0.95 的置信区间为_____.
解 设 EX=μ,由中心极限定理 U=nσXˉ−μ 近似服从 N(0,1),
令
P{∣U∣<u2α}≈1−0.05=0.95,
查正态分布表,得 u2α=1.96,代入 X 的数学期望的置信区间
[Xˉ−u2αnσ,Xˉ+u2αnσ],
经计算为 (4.804,5.196).
故应填 (4.804,5.196).
点评 本题未说明总体 X 为正态分布,因此直接套用正态总体 μ 的置信区间公式不妥,应该先用中心极限定理取近似, 再根据定义求出置信区间.
§4. 综合提高题型
题型1: 关于点估计
【4.1】设总体 X 的概率密度为
f(x;θ)={e−(x−θ),0, 若 x≥θ 若 x<θ
而 X1,X2,⋯,Xn 是来自总体 X 的简单随机样本,则未知参数 θ 的矩估计量为_____.
解 EX=∫0+∞xe−(x−θ)dx=θ+1,即 θ=EX−1.
因此 θ 的矩估计量为
θ=Xˉ−1=n1i=1∑nXi−1.
【4.2】设总体 X 的概率密度为
f(x)={θ36x(θ−x),0,0<x<θ 其他
X1,X2,⋯,Xn 是取自总体 X 的简单随机样本.
(1)求 θ 的矩估计量 θ;
(2) 求 θ 的方差 D(θ).
解 (1) EX=∫−∞+∞xf(x)dx=∫0θθ36x2(θ−x)dx=∫0θ(θ26x2−θ36x3)dx=2θ,
因此 θ=2EX,所以 θ 的矩估计量为 θ=2Xˉ.
(2)由(1)可知,
EX=2θ,EX2=∫0θθ36x3(θ−x)dx=206θ2,
故
DX=EX2−(EX)2=206θ2−(2θ)2=20θ2,
因此
D(θ)=D(2Xˉ)=4D(Xˉ)=n4D(X)=n4×20θ2=5nθ2.
【4.3】设 X1,X2,⋯,Xn 为总体的一个样本,求下列各总体的密度函数或分布律中的未知参数的矩估计量和最大似然估计量.
(1) f(x)={θcθx−(θ+1),0,x>c 其他 ,其中 c>0 为已知, θ>1, θ 为未知参数.
(2) f(x)={θxθ−1,0,0≤x≤1 其他 ,其中 θ>0,θ 为未知参数.
(3) P{X=x}=Cmxpx(1−p)m−x,x=0,1,2,⋯,m,0<p<1,p 为未知参数.
解 (1) E(X)=∫c∞xθcθx−(θ+1)dx=∫c∞θcθx−θdx=θcθ∫cθx−θdx=θcθ−θ+1x−θ+1c+∞
=θ−1θc.
令 θ−1θc=Xˉ,解得 θ=Xˉ−cXˉ,即为 θ 的矩估计量.
似然函数为
L(θ)=i=1∏nθ⋅cθxi−(θ+1)=θncnθi=1∏nxi−(θ+1),
而
lnL(θ)=nlnθ+nθlnc−(θ+1)i=1∑nlnxi,
令
dθdlnL(θ)=θn+nlnc−i=1∑nlnxi=0,
解得 θ 的最大似然估计量 θ=i=1∑nlnXi−nlncn.
(2) EX=∫01xθxθ−1dx=∫01θxθdx=θ+1θxθ+101=θ+1θ.
令 θ+1θ=Xˉ,解得 θ=(Xˉ−1Xˉ)2,即为 θ 的矩估计量.
似然函数为:
L(θ)=i=1∏nθxiθ−1=θ2ni=1∏nxiθ−1,
对数似然函数为:
lnL(θ)=2nlnθ+(θ−1)i=1∑nlnxi,
对数似然方程为:
dθdlnL(θ)=2θn+2θi=1∑nlnxi=0,
其最大似然估计值为 θ=(i=1∑nlnxi)2n2,θ=(i=1∑nlnXi)2n2 即为 θ 的最大似然估计量.
(3)因为 X∼B(m,p),所以
E(X)=i=1∑nxCmxpx(1−p)m−x=mp,
所以 mp=Xˉ,p=mXˉ 为 p 的矩估计.
似然函数为:
L(p)=i=1∏nCmlxipxi(1−p)m−xi=pi=1i=1∑nxi(1−p)nm−i=1∑nxii=1∏nCmℓxi,
对数似然函数为:
lnL(p)=i=1∑nxilnp+(nm−i=1∑nxi)ln(1−p)+i=1∑nlnCnixi,
对数似然方程为:
dpdlnL(p)=pi=1∑nxi+1−pnm−i=1∑nxi(−1)=0,
则 p=mxˉ 为 p 的最大似然估计值. p=mXˉ 为 p 的最大似然估计量.
【4.4】某工程师为了解一台天平的精度,用该天平对一物体的质量做 n 次测量,该物质的质量 μ 是已知的,设 n 次测量结果 X1,X2,⋯,Xn 相互独立且均服从正态分布 N(μ,σ2). 该工程师记录的是 n 次测量的绝对误差 Zi=∣Xi−μ∣(i=1,2,⋯,n),利用 Z1,Z2,⋯,Zn 估计 σ.
(1)求 Z1 的概率密度;(2)利用一阶矩求 σ 的矩估计量;(3)求 σ 的最大似然估计量.
解 (1) Z1 的分布函数为
F(z)=P{Z1≤z}=P{∣X1−μ∣≤z}={2Φ(σz)−1,0,z≥0,z<0,
所以 Z1 的概率密度为
f(z)={2πσ2e−2σ2z2,0,z≥0,z<0
(2) EZ1=∫−∞+∞zf(z)dz=2πσ2∫−∞+∞ze−2σ2z2dz=2π2σ.
σ=22πEZ1,令 Zˉ=n1i=1∑nZi,得 σ 的矩估计量为 σ=22πZˉ.
(3)记 z1,z2,⋯,zn 为样本 Z1,Z2,⋯,Zn 的观测值,则似然函数为
L(σ)=i=1∏nf(zi)=(2π2)nσ−ne−2σ21i=1∑nzi2,
对数似然函数为 lnL(σ)=nln2π2−nlnσ−2σ21i=1∑nzi2.
令 dσdlnL(σ)=−σn+σ31i=1∑nzi2=0,得 σ 的最大似然估计值为 σ=n1i=1∑nzi2,所以 σ 的最大似然估计量为 σ=n1i=1∑nzi2.
【4.5】设总体 X 的概率密度为
f(x;θ)={x3θ2e−xθ,0,x>0, 其他,
其中 θ 为未知参数且大于零, X1,X2,⋯,Xn 为来自总体 X 的简单随机样本.
(1)求 θ 的矩估计量;
(2)求 θ 的最大似然估计量.
解 (1) EX=∫0+∞x⋅x3θ2e−xθdx
=∫0+∞x2θ2e−xθdx=θ.
所以 θ 的矩估计量为 θ=Xˉ,其中 Xˉ=n1i=1∑nXi.
(2)设 x1,x2,⋯,xn 为样本观测值,似然函数为
L(θ)=i=1∏nf(xi;θ)
=⎩⎨⎧(x1x2⋯xn)3θ2ne−θi=1∑nxi1,0,x1,x2,⋯,xn>0, 其他.
当 x1,x2,⋯,xn>0 时, lnL(θ)=2nlnθ−θi=1∑nxi1−3i=1∑nlnxi.
令 dθdlnL(θ)=θ2n−i=1∑nxi1=0,得 θ 的最大似然估计值为 θ=i=1∑nxi12n,所以 θ 的最大似然估
计量为 θ=i=1∑nXi12n.
【4.6】设总体 X 服从几何分布 P{X=k}=p(1−p)k−1,k=1,2,⋯. 又 x1,x2,⋯,xn 是来自 X 的样本值,则 p 与 EX 的最大似然估计分别为多少?
解 L(p)=pn(1−p)i=1∑nxi−n,
令 dpdlnL=0,解得 p=i=1∑nxin=Xˉ1,故 p=Xˉ1 即为 p 的最大似然估计.
而 EX=p1,故由最大似然估计不变性 EX⏜=p1=Xˉ 为 EX 的最大似然估计.
【4.7】设总体 X 的概率密度为
f(x)={λ2xe−λx,0,x>0 其他
其中参数 λ(λ>0) 未知, X1,X2,⋯,Xn 是来自总体 X 的简单随机样本.
(1)求参数 λ 的矩估计量;
(2)求参数 λ 的最大似然估计量.
解 (1) EX=∫−∞+∞xf(x)dx=∫0+∞λ2x2e−λxdx=λ2.
令 Xˉ=EX,即 Xˉ=λ2,得 λ 的矩估计量为 λ=Xˉ2.
(2)设 x1,x2,⋯,xn(xi>0,i=1,2,⋯,n) 为样本观测值,则似然函数为
L(x1,x2,⋯,xn;λ)=λ2ne−λi=1∑nxii=1∏nxi,
lnL=2nlnλ−λi=1∑nxi+i=1∑nlnxi,
由 dλdlnL=λ2n−i=1∑nxi=0,得 λ 的最大似然估计量为 λ=Xˉ2.
【4.8】设随机变量 X 的分布函数为
F(x;α,β)={1−(xα)β,0,x>αx≤α
其中参数 α>0,β>1,设 X1,X2,⋯,Xn 为来自总体 X 的简单随机样本.
(1)当 α=1 时,求未知参数 β 的矩估计量;
(2)当 α=1 时,求未知参数 β 的最大似然估计量;
(3)当 β=2 时,求未知参数 α 的最大似然估计量.
解 (1) 由已知 X 的分布函数可得其概率密度为
f(x;α,β)={xβ+1βαβ,0,x>αx≤α
当 α=1 时, X 的概率密度为
f(x;β)={xβ+1β,0,x>1x≤1,
EX=∫−∞+∞xf(x;β)dx=∫1+∞xββdx=β−1β,
令 β−1β=Xˉ,解得 β=Xˉ−1Xˉ,所以 β 的矩估计量为 β=Xˉ−1Xˉ,其中 Xˉ=n1i=1∑nXi.
(2)对于总体 X 的样本值 x1,x2,⋯,xn,似然函数为
L(β)={(x1x2⋯xn)β+1βn,0,xi>1(i=1,2,⋯,n) 其他
当 xi>1 时,两边取对数得
lnL(β)=nlnβ−(β+1)i=1∑nlnxi,dβdlnL(β)=βn−i=1∑nlnxi,
令 dβdlnL(β)=0,解之得 β=i=1∑nlnxin.
故 β 的最大似然估计量为 β=i=1∑nlnXin.
(3)当 β=2 时, X 的概率密度为
f(x;α)={x32α2,0,x>αx≤α
对于总体 X 的样本值 x1,x2,⋯,xn,其似然函数为
L(α)={(x1x2⋯xn)32nα2n,0,xi>α(i=1,2,⋯,n) 其他
lnL(α)=nln2+2nlnα−3i=1∑nlnxi,dαdlnL(α)=α2n>0,
所以 L(α) 单调递增.
当 xi>α(i=1,2,⋯,n) 时, α 越大, L(α) 就越大,因此 α 的最大似然估计值为
α=min(x1,x2,⋯,xn).
则 α 的最大似然估计量为 α=min(X1,X2,⋯,Xn).
【4.9】设某种电子器件的寿命 (以小时计) T 服从双参数的指数分布,其概率密度为
f(t)={θ1e−θt−c,0,t≥c 其他
其中 c,θ(c,θ>0) 为未知参数,自一批这种器件中随机地取 n 件进行寿命试验. 设它们的失效时间依次为 x1≤x2≤⋯≤xn.
(1)求 θ 与 c 的最大似然估计;
(2)求 θ 与 c 的矩估计.
解 (1) 似然函数为
L(θ,c)=⎩⎨⎧θn1e−θ1i=1∑n(xi−c),0,xi≥c,i=1,2,⋯,n 其他
=⎩⎨⎧θn1e−θ1i=1∑n(xi−c),0,xn≥xn−1≥⋯≥x2≥x1≥c 其他
对数似然函数为:
lnL(θ,c)=−nlnθ−θ1i=1∑n(xi−c),
对数似然方程为:
∂c∂lnL(θ,c)=θn>0,
故 lnL(θ,c) 关于 c 单调增加,故 c=x1.
由
∂θ∂lnL(θ,c)=−θn+θ21i=1∑n(xi−c)=0,
得 θ 的最大似然估计值为 θ=xˉ−x1.
(2) EX=∫−∞+∞xf(x)dx=∫c+∞θxe−θx−cdx=θ+c,
E(X2)=∫c+∞θx2e−θx−cdx=θ2+(θ+c)2,
令 EX=xˉ,E(X2)=n1i=1∑nxi2,那么 θ 和 c 的矩估计为
θ=n1i=1∑n(xi−xˉ)2,c=xˉ−n1i=1∑n(xi−xˉ)2.
【4. 10】设总体 X 的概率密度为
f(x)={2e−2(x−θ),0,x>θx≤θ
其中 θ>0 是未知参数,从总体中抽取简单随机样本 X1,X2,⋯,Xn. 记 θ=min(X1,X2,⋯,Xn).
(1)求总体 X 的分布函数 F(x);
(2)求统计量 θ 的分布函数 Fθ(x);
(3)如果用 θ 作为 θ 的估计量,讨论它是否具有无偏性.
解 (1) 由总体 X 的概率密度可得
F(x)=∫−∞xf(t)dt={1−e−2(x−θ),0,x≥θx<θ
(2) Fθ(x)=P{θ≤x}=P{min(X1,X2,⋯,Xn)≤x}
=1−P{min(X1,X2,⋯,Xn)>x}
=1−P{X1>x,X2>x,⋯,Xn>x}
=1−P{X1>x}P{X2>x}⋯P{Xn>x}.
由于 P{Xi>x}=1−P{Xi≤x}=1−F(x),因此 F∂(x)=1−[1−F(x)]n.
即 Fθ(x)={1−e−2n(x−θ),0,x≥θx<θ
(3) 由 Fθ(x)={1−e−2n(x−θ),0,x≥θx<θ,可得 θ 的概率密度为
fθ(x)=Fθ′(x)={2ne−2n(x−θ),0,x≥θx<θ
则
Eθ=∫−∞∞xfθ(x)dx=∫θ∞2nxe−2n(x−θ)dx=θ+2n1,
故 Eθ=θ. 因此 θ 不是 θ 的无偏估计.
【4.11】设总体 X 的概率密度为
f(x;θ)={3θ22x,0,θ<x<2θ, 其他,
其中 θ 是未知参数, X1,X2,⋯,Xn 为来自总体 X 的简单随机样本. 若 ci=1∑nXi2 是 θ2 的无偏估计, 则 c= _____.
解 E(ci=1∑nXi2)=ci=1∑nE(Xi2)=ci=1∑nE(X2)
=cn∫−∞+∞x2f(x)dx=cn∫θ2θx2⋅3θ22xdx=cn⋅25θ2.
因为 ci=1∑nXi2 是 θ2 的无偏性估计,所以 E(ci=1∑nXi2)=θ2.
即 cn⋅25θ2=θ2,所以 c=5n2.
故应填 5n2.
【4.12】设总体 X 服从 [0,θ] 上的均匀分布, θ 未知 (θ>0), X1, X2, X3 是取自 X 的一个样本.
(1)试证 θ1=34ma1≤i≤3xXi,θ2=4mi1≤i≤3nXi 都是 θ 的无偏估计;
(2)上述两个估计中哪个更有效?
证 (1) 设 F(x) 是 X 的分布函数,则
F(x)=⎩⎨⎧1,θx,0,x>θ0≤x≤θx<0
Y=max1≤i≤3xXi,Z=min1≤i≤3nXi,
FY(x)=[F(x)]3,fY(x,θ)={3(θx)2⋅θ1,0,0≤x≤θ 其他
故 EY=θ33∫0θx3dx=43θ,则 E(θ1)=E(34maxXi)=θ,
同理 EZ=θ33∫0θx(θ−x)2dx=41θ,则 E(θ2)=E(4minXi)=θ.
(2) DY=EY2−(EY)2=θ3∫0θx2(θx)2dx−(43θ)2=803θ2,
故 D(θ1)=D(34maxXi)=916DY=151θ2,
同理 DZ=803θ2,故 D(θ2)=D(4minXi)=16DZ=53θ2>D(θ1),
故 θ1 更有效.
【4.13】设随机变量 X 与 Y 相互独立且分别服从正态分布 N(μ,σ2) 与 N(μ,2σ2),其中 σ 是未知参数且 σ>0,记 Z=X−Y.
(1)求 Z 的概率密度 f(z);
( 2 )设 Z1,Z2,⋯,Zn 为来自总体 Z 的简单随机样本,求 σ2 的最大似然估计量 σ2;
(3)证明 σ2 为 σ2 的无偏估计量.
解 (1)因为 X 与 Y 相互独立且分别服从正态分布 N(μ,σ2) 与 N(μ,2σ2),则 Z=X−Y 服从正态分布 N(0,3σ2),故 Z 的概率密度
f(z)=6πσ1e−6σ2z2,−∞<z<+∞.
(2)设 z1,z2,⋯,zn 是样本 Z1,Z2,⋯,Zn 所对应的一个样本值,则似然函数为
L(σ2)=i=1∏nf(zi)=(6π)n(σ2)2n1e6σ2i=1∑nzi2,
lnL(σ2)=−2nln(6π)−2nlnσ2−6σ21i=1∑nzi2
令 d(σ2)dlnL(σ2)=6σ41i=1∑nzi2−2σ2n=0,
得 σ2=3n1i=1∑nzi2
故 σ2 的最大似然估计量为 σ2=3n1i=1∑nZi2.
(3) 因为 E(σ2)=E(3n1i=1∑nZi2)=3n1E(i=1∑nZi2)=31E(Z2)=31D(Z)=σ2,
故 σ2 为 σ2 的无偏估计量.
【4.14】设总体 X 的概率分布为
$X$ | 1 | 2 | 3 |
$P$ | $1 - \theta$ | $\theta - {\theta }^{2}$ | ${\theta }^{2}$ |
其中参数 θ∈(0,1) 未知,以 Ni 表示来自总体 X 的简单随机样本 (样本容量为 n ) 中等于 i 的个数 (i=1,2,3),试求常数 a1,a2,a3,使 T=i=1∑3aiNi 为 θ 的无偏估计量,并求 T 的方差.
解 根据简单随机样本的性质,样本 X1,X2,⋯,Xn 相互独立且与总体 X 同分布,因此, P{Xi=1}=1−θ,P{Xi=1}=θ,i=1,2,⋯,n,则在 n 次独立观测中取 1 的个数 N1 是个随机变量,且 N1∼B(n,1−θ),同理 N2∼B(n,θ−θ2),N3∼B(n,θ2),所以
ET=E(i=1∑3aiNi)=a1EN1+a2EN2+a3EN3
=a1n(1−θ)+a2n(θ−θ2)+a3nθ2
=na1+n(a2−a1)θ+n(a3−a2)θ2
由 T 是 θ 的无偏估计量,可知 ET=θ,
则 ⎩⎨⎧na1=0,n(a2−a1)=1,n(a3−a2)=0, 即 ⎩⎨⎧a1=0,a2=n1,a3=n1.
故 T=0×N1+n1×N2+n1×N3=n1(N2+N3)=n1(n−N1).
DT=D[n1(n−N1)]=n21DN1=n21⋅n⋅(1−θ)⋅θ=n1θ(1−θ).
【4.15】设 X1,X2,X3,X4 是来自均值为 θ 的指数分布总体的样本,其中 θ 未知. 设有估计量
T1=61(X1+X2)+31(X3+X4),T2=5X1+2X2+3X3+4X4,
T3=4X1+X2+X3+X4.
(1) 指出 T1,T2,T3 中哪几个是 θ 的无偏估计量;
(2)在上述 θ 的无偏估计中指出哪一个较为有效.
解 (1) ET1=61(EX1+EX2)+31(EX3+EX4)=61(θ+θ)+31(θ+θ)=θ,
ET2=51(EX1+2EX2+3EX3+4EX4)=51(θ+2θ+3θ+4θ)=2θ,
ET3=41(EX1+EX2+EX3+EX4)=41(θ+θ+θ+θ)=θ.
故 T1,T3 为 θ 的无偏估计量.
(2) DT1=361(DX1+DX2)+91(DX3+DX4)=361(θ2+θ2)+91(θ2+θ2)=185θ2,
DT3=161(DX1+DX2+DX3+DX4)=161(θ2+θ2+θ2+θ2)=41θ2,
DT1>DT3.
故 T3 较 T1 更有效.
【4.16】设 θ 是参数 θ 的无偏估计,且有 D(θ)>0,试证 (θ)2 不是 θ2 的无偏估计.
证 E(θ2)=D(θ)+(Eθ)2=D(θ)+θ2>θ2(D(θ)>0),
所以 θ2 不是 θ2 的无偏估计量.
【4.17】设总体 X 的均值为 μ,统计量 μ1 和 μ2 是参数 μ 的两个无偏估计量,它们的方差分别为 σ12,σ22,相关系数为 ρ,试确定常数 c1>0,c2>0,c1+c2=1,使得 c1μ1Λ+c2μ2Λ 有最小方差.
解 D(c1μΛ1+c2μΛ2)=c12D(μΛ1)+c22D(μΛ2)+2c1c2Cov(μΛ1,μΛ2)
=c12σ12+c22σ22+2c1c2ρσ1σ2,
利用高等数学知识,求 D(c1μ1+c2μ2) 在 c1+c2=1(c1>0,c2>0) 条件下的最小值点,一种方法是使用拉格朗日乘数法,另一种方法是将 c2=1−c1 代入化成无条件极值问题,最终解得
c1=σ12−2ρσ1σ2+σ22σ2(σ2−ρσ1),c2=σ12−2ρσ1σ2+σ22σ1(σ1−ρσ2).
此时 c1μ1+c2μ2 的方差达到最小.
【4.18】设总体 X∼U(θ,2θ),其中 θ>0 是未知参数,又 X1,X2,⋯,Xn 为取自该总体的样本,证明 θ=32Xˉ 是 θ 的无偏估计和相合估计.
证
E(θ)=32E(Xˉ)=32E(X)=32⋅2θ+2θ=θ,
故 θ 是 θ 的无偏估计.
D(θ)=94D(Xˉ)=94⋅nD(X)=9n4⋅12θ2=27nθ2.
当 n→∞ 时, D(θ)→0,故 θ 是 θ 的相合估计.
【4.19】设 X1,X2,⋯,Xn 是总体为 N(μ,σ2) 的简单随机样本,记
Xˉ=n1i=1∑nXi,S2=n−11i=1∑n(Xi−Xˉ)2,T=Xˉ2−n1S2,
(1)证明 T 是 μ2 的无偏估计量;
(2)当 μ=0,σ=1 时,求 DT.
证 (1)E(T)=E(Xˉ2−n1S2)=EXˉ2−E(n1S2)=EXˉ2−n1σ2,
因为: X∼N(μ,σ2),Xˉ∼N(μ,nσ2),而
EXˉ2=DXˉ+(EXˉ)2=n1σ2+μ2,E(T)=n1σ2+μ2−n1σ2=μ2,
所以 T 是 μ2 的无偏估计.
解 (2) DT=ET2−(ET)2,E(T)=0,ET2=E(Xˉ4−n2Xˉ2⋅S2+n2S4),
因为 Xˉ∼N(0,n1),n1Xˉ∼N(0,1),
令 X=n1Xˉ,E(X4)=∫−∞+∞2πx4e−2x2dx=∫−∞+∞2π3x2e−2x2dx=3EX2=3,
所以 EXˉ4=n23,
E(n2Xˉ2⋅S2)=n2EXˉ2⋅ES2=n2[DXˉ+(EXˉ)2]=n2(n1+0)=n22,
E(n2S4)=n21ES4,ES4=DS2+(ES2)2=DS2+1.
因为 W=σ2(n−1)S2∼χ2(n−1),且 σ2=1,
所以 DW=(n−1)2DS2=2(n−1),DS2=n−12,ES4=n−12+1=n−1n+1,
故 ET2=n23−n22+n21⋅n−1n+1=n(n−1)2.
题型 2: 关于区间估计
【4.20】从长期生产实践知道,某厂生产的 100W 灯泡的使用寿命 X∼N(μ,1002) (单位: h), 现从某一批灯泡中抽取 5 只, 测得使用寿命如下:
14551502137016101430
试求这批灯泡平均使用寿命 μ 的置信区间 ( α 分别为 0.1 和 0.05).
解 由样本值得
Xˉ=51(1455+1502+1370+1610+1430)=1473.4,
当 α=0.1,查表得 u2α=1.64,故
Xˉ−u2αnσ=1473.4−1.64×5100=1400.1,
Xˉ+u2αnσ=1473.4+1.64×5100=1546.7,
于是置信度 90% 下,平均使用寿命 μ 的置信区间为 [1400.1,1546.7].
当 α=0.05 时,查表得 u2α=1.96,故
Xˉ−u2αnσ=1473.4−1.96×5100=1385.7,
Xˉ+u2αnσ=1473.4+1.96×5100=1561.1,
于是置信度 95% 下,平均使用寿命 μ 的置信区间为[1385.7,1561.1].
【4.21】设总体 X∼N(μ,σ2),x1,x2,⋯,x15 是其一组样本值,已知
i=1∑15xi=8.7,i=1∑15xi2=25.05,
求置信水平为 0.95 的 μ 和 σ2 的置信区间.
解 xˉ=151i=1∑15xi=151×8.7=0.58,
S2=141i=1∑15(xi−xˉ)2=141(i=1∑15xi2−15xˉ2)=1.429,
查表得 t2α(n−1)=t0.025(14)=2.1448,
χ1−2α2(n−1)=χ0.9752(14)=5.629,χ2α2(n−1)=χ0.0252(14)=26.119,
代入公式可得置信区间为
μ:[Xˉ±t2α(n−1)nS]=[−0.082,1.242],
σ2:[χ2α2(n−1)(n−1)S2,χ1−2α2(n−1)(n−1)S2]=[0.766,3.554].
【4.22】假如0.50,1.25,0.80,2.00是来自总体 X 的简单随机样本值,已知 Y=lnX 服从正态分布 N(μ,1).
(1)求 X 的数学期望 EX (记 EX 为 b );
(2)求 μ 的置信度为 0.95 的置信区间;
(3)利用上述结果求 b 的置信度为 0.95 的置信区间.
分析 本题是一个正态总体方差已知时求期望值 μ 的置信区间问题. 在 μ 的置信区间解得的情况下,利用 b 的表达式中含有 μ 这一特点,代入 μ 的置信区间即可得 b 的置信区间.
解 (1) 由题意知 Y 的概率密度为
f(y)=2π1e−2(y−μ)2.
又由 Y=lnX,得 X=eY,故
b=EX=EeY=∫−∞+∞2π1eye−2(y−μ)2dy
=eμ+21∫−∞+∞2π1e−21[y−(μ+1)]2dy=eμ+21.
(2)经过分析, μ 的置信区间公式为 (Yˉ−nσu2α,Yˉ+nσu2α).
由 1−α=0.95,查表得 u2α=1.96.
代入 σ=1,n=4,yˉ=41(ln0.5+ln1.25+ln0.8+ln2)=0,
得 (−21×1.96,21×1.96).
故 μ 的置信度为 0.95 的置信区间为 (−0.98,0.98).
(3)由(1)可知, b=EX=eμ+21,又由(2)知, μ 的置信区间为(-0.98,0.98),
因为 ex 为严格增函数,所以 b 的置信区间为 (e−0.98+21,e0.98+21),
即为 (e−0.48,e1.48).
【4.23】随机地取某种炮弹 9 发做实验,得炮口速度的样本标准差 s=11(m/s),设炮口速度服从正态分布,求这种炮弹的炮口速度的标准差 σ 的置信度为 0.95 的置信区间.
解 由 σ2 的置信区间公式知, σ 的置信度为 0.95 的置信区间为
χ2α2(n−1)n−1S,χ1−2α2(n−1)n−1S.
其中 s=11,n−1=8,1−α=0.95,α=0.05,2α=0.025.
查表得 χ2α2(8)=17.535,χ1−2α2(8)=2.180,代入得到 σ 的置信区间为 (7.4,21.1).
【4.24】分别使用金球和铂球测定引力常数 (单位: 10−11m3⋅kg−1⋅s−1 ).
(1)用金球测定观察值为6.683,6.681,6.676,6.678,6.679,6.672.
(2)用铂球测定观察值为6.661,6.661,6.667,6.667,6.664.
设测定值总体为 N(μ,σ2),μ,σ2 均为未知,试就 (1),(2) 两种情况分别求 μ 的置信度为 0.9 的置信区间,并求 σ2 的置信度为 0.9 的置信区间.
解 (1) μ,σ2 均未知时, μ 的置信度为 0.9 的置信区间为
[Xˉ−nSt2α(n−1),Xˉ+nSt2α(n−1)],
这里 1−α=0.9,α=0.1,2α=0.05,n1=6,n2=5,n1−1=5,n2−1=4.
xˉ1=61i=1∑6xi=61(6.683+⋯+6.672)=6.678,
s12=51i=1∑6(xi−xˉ1)2=0.15×10−4,
xˉ2=51i=1∑5xi=51(6.661+⋯+6.664)=6.664,
s22=41i=1∑5(xi−xˉ2)2=0.9×10−5,
t2α(5)=2.0150,t2α(4)=2.1318.
代入得,用金球测定时, μ 的置信区间是 [6.675,6.681].
用铂球测定时, μ 的置信区间为 [6.661,6.667].
(2) μ,σ2 均未知时, σ2 的置信度为 0.9 的置信区间为
[χ2α2(n−1)(n−1)S2,χ1−2α2(n−1)(n−1)S2],
这里 n1−1=5,n2−1=4,2α=0.05.
查表得: χ2α2(5)=11.071,χ2α2(4)=9.488,χ1−2α2(5)=1.145,χ1−2α2(4)=0.711.
将这些值以及上面 (1) 中算得的 S12,S22 代入上区间得
用金球测定时, σ2 的置信区间是 [6.774×10−6,6.550×10−5].
用铂球测定时, σ2 的置信区间是 [3.794×10−6,5.063×10−5].
【4.25】设 x1,x2,⋯,xn 为来自总体 N(μ,σ2) 的简单随机样本,样本均值 xˉ=9.5,参数 μ 的置信度为 0.95 的双侧置信区间的置信上限为 10.8,则 μ 的置信度为 0.95 的双侧置信区间为 _____.
解 设 X∼N(μ,σ2),其中 σ2 未知,则 μ 的置信区间为
(xˉ−t2α(n−1)nS,xˉ+t2α(n−1)nS).
已知 xˉ=9.5,置信上限为 10.8,则
t2α(n−1)nS=1.3,置信下限为 8.2.
故应填 (8.2,10.8).
【4. 26】设某种清漆的 9 个样品,其干燥时间(单位:h) 分别为
6.05.75.86.57.06.35.66.15.0
设干燥时间总体服从正态分布 N(μ,σ2),求 μ 的置信度为 0.95 的置信区间.
(1)若由以往经验知 σ=0.6 (小时);
(2)若 σ 为未知.
解 (1) 当方差 σ2 已知时, μ 的置信度为 0.95 的置信区间为
[Xˉ−nσu2α,Xˉ+nσu2α],
这里, 1−α=0.95,α=0.05,2α=0.025,n=9,σ=0.6,xˉ=91(6.0+5.7+⋯+5.0)=6,
查正态分布表得 u2α=1.96.
将这些值代入公式得 [5.608,6.392].
(2)当方差 σ2 未知时, μ 的置信度为 0.95 的置信区间为
[Xˉ−nSt2α(n−1),Xˉ+nSt2α(n−1)],
这里, 1−α=0.95,α=0.05,2α=0.025,n−1=8.
查表得 t2α(n−1)=2.3060,
xˉ=91(6.0+5.7+⋯+5.0)=6,s2=n−11i=1∑n(xi−xˉ)2=0.33.
将这些值代入公式得 [5.558,6.442].
【4.27】随机地从 A 批导线中抽取 4 根,又从 B 批导线中抽取 5 根,测得电阻 (单位: Ω ) 为
A 批导线: 0.143 0.142 0.143 0.137
B 批导线: 0.1400.1420.1360.1380.140
设测定数据分别来自分布 N(μ1,σ2),N(μ2,σ2),且两样本相互独立,又 μ1,μ2,σ2 均为未知, 试求 μ1−μ2 的置信度为 0.95 的置信区间.
解 μ1−μ2 的置信区间为
[Xˉ−Yˉ−t2α(n1+n2−2)Swn11+n21,Xˉ−Yˉ+t2α(n1+n2−2)Swn11+n21],
在这里 Xˉ=41i=1∑4Xi=41(0.143+⋯+0.137)=0.1413,
Yˉ=51(0.140+⋯+0.140)=0.1392,
n1=4,n2=5,n1+n2−2=7;1−α=0.95,α=0.05,2α=0.025.
查表得 t2α(7)=2.3646,
sw2=n1+n2−2(n1−1)s12+(n2−1)s22=6.509×10−6,sw=6.509×10−6=2.551×
10−3.
将这些值代入上区间得 (−0.002,0.006).
【4.28】研究两种固体燃料火箭推进器的燃烧率, 设两者都服从正态分布, 并且已知燃烧率的标准差均近似地为 0.05cm/s,取样本容量为 n1=n2=20,得燃烧率的样本均值分别为 x1= 18cm/s,x2=24cm/s,求两燃烧率总体均值差 μ1−μ2 的置信度为 0.99 的置信区间.
解 在此题中, σ1=σ2=0.05,因此, μ1−μ2 的置信度为 0.99 的置信区间
(Xˉ1−Xˉ2−u2ασn11+n21,Xˉ1−Xˉ2+u2ασn11+n21),
这里 n1=n2=20,α=0.01,2α=0.005.
查表得 u2α=2.58. 代入上区间得 (−6.04,−5.96).
【4.29】设两位化验员 A,B 独立地对某种聚合物含氯量用相同的方法各作 10 次测定,其测定值的样本方差依次为 SA2=0.5419,SB2=0.6065. 设 σA2,σB2 分别为 A,B 所测定的测定值总体的方差,设总体均为正态分布,求方差比 σB2σA2 的置信度为 0.95 的置信区间.
解 σB2σA2 的置信区间为
[SB2SA2F2α(n1−1,n2−1)1,SB2SA2F1−2α(n1−1,n2−1)1],
这里 1−α=0.95,α=0.05,2α=0.025. 查表得 F2α(9,9)=4.03,F1−2α(9,9)=4.031.
代入上式得 (0.222,3.601).
【4. 30】(1)求【4. 26】题中 μ 的置信度为 0.95 的单侧置信上限;
(2)求【4.27】题中 μ1−μ2 的置信度为 0.95 的单侧置信下限;
(3)求【4.29】题中方差比 σB2σA2 的置信度为 0.95 的单侧置信上限.
解 (1) σ2 已知时,此时 nσXˉ−μ∼N(0,1),于是
P{nσXˉ−μ>u1−α}=1−α, 即 P{nσXˉ−μ>−uα}=1−α.
于是, μ 的置信度为 1−α 的单侧置信区间为 (−∞,Xˉ+uα⋅nσ). 则 Xˉ+uα⋅nσ 为其单侧置信上限. 此时 α=0.05,查表得 uα=1.65,Xˉ=6,σ=0.6,n=
- 代入上式得 μˉ=xˉ+uα⋅nσ=6.33.
方差 σ2 未知,此时 nSXˉ−μ∼t(n−1). 于是 P{nSXˉ−μ>t1−α(n−1)}=1−α,得
nSXˉ−μ>t1−α(n−1),μ<Xˉ−t1−α(n−1)nS=Xˉ+tα(n−1)nS.
此处 Xˉ=6,S2=0.33,n=9. 查表得 t0.05(8)=1.8598.
代入上式得 μˉ=xˉ+tα(n−1)⋅ns=6.356.
(2) 未知,此时
Swn11+n21(Xˉ−Yˉ)−(μ1−μ2)∼t(n1+n2−2),
P⎩⎨⎧Swn11+n21(Xˉ−Yˉ)−(μ1−μ2)<tα(n1+n2−2)⎭⎬⎫=1−α=0.95,
由此得 μ1−μ2 的置信度为 0.95 的单侧置信下限为
Xˉ−Yˉ−Swn11+n21⋅tα(n1+n2−2).
将【4.27】题中的 Xˉ,Yˉ,Sw 代入上式得 (tα(n1+n2−2)=1.8946),
xˉ−yˉ−swn11+n21⋅tα(n1+n2−2)=−0.0012.
(3) 此时 σ22S22σ12S12∼F(n1−1,n2−1),于是
P⎩⎨⎧σ22S22σ12S12>F1−α(n1−1,n2−1)⎭⎬⎫=1−α,
由此得 σ22σ12 的置信度为 0.95 的单侧置信上限为
S22S12F1−α(n1−1,n2−1)1=S22S12⋅Fα(n2−1,n1−1),
查表得 Fα(n2−1,n1−1)=3.18.
将【4.29】题中的 S12,S22 值及 Fα(n2−1,n1−1) 代入上式得,单侧置信上限为 2.84.
【4.31】为研究某种汽车轮胎的磨损特性, 随机地选择 16 只轮胎, 每只轮胎行驶到磨坏为止, 记录所行驶路径(以公里计) 如下:
4125040187431754101039265418724265441287
3897040200425504109540680435003977540400
假设这些数据来自正态总体 N(μ,σ2),其中 μ,σ2 未知,试求 μ 的置信度为 0.95 的单侧置信下限.
解 σ 未知,此时
nSXˉ−μ∼t(n−1),P{nSXˉ−μ<tα(n−1)}=1−α,
由此得 μ 的置信度为 1−α 的单侧置信下限为 Xˉ−tα(n−1)⋅nS,
这里 xˉ=161(41250+⋯+40400)=41117,s=1347,
查表得 t0.05(15)=1.7531,代入上式得 xˉ−tα(n−1)⋅ns=40526.
题型 3: 与置信度、样本容量及区间长度有关的题目
【4.32】从正态总体 N(μ,62) 中抽取容量为 n 的样本. 若保证 μ 的 95% 的置信区间的长度不大于 2,问 n 至少应取多大?
解 由 σ2=62 得 6Xˉ−μn∼N(0,1),故置信区间为
[Xˉ−u2αnσ,Xˉ+u2αnσ].
从而得均值 μ 的置信区间的长度为
2u2α⋅nσ≤2
即 n≥(u2α⋅σ)2=(1.96×6)2≈139.
【4.33】设总体 X∼N(μ,8),(X1,⋯,X36) 为其简单随机样本,若 [Xˉ−1,Xˉ+1] 作为 μ 的置信区间,则置信度为_____.
解 本题属于已知 σ2,估计 μ 的类型.
μ 的满足置信度为 1−α 的置信区间应为
[Xˉ−u2αnσ,Xˉ+u2αnσ].
由题意, u2αnσ=1,且 σ=8,n=36.
故 u2α=2.12,查表可得置信度 1−α=0.966.
【4.34】设 X∼N(μ,σ2),σ2 已知,若样本容量 n 和置信度 1−α 均不变,则对于不同的样本观测值, μ 的置信区间长度( ).
(A) 变长 (B) 变短 (C) 保持不变 (D) 不能确定
解 μ 的置信区间是
[Xˉ−u2αnσ,Xˉ+u2αnσ],
因为 n 和 1−α 不变,所以长度 l=2u2αnσ 保持不变.
故应选(C).
【4.35】设样本 (X1,X2,⋯,Xn) 为总体 X∼N(μ,σ2) 的样本,其中 μ,σ2 为未知参数,设随机变量 L 是关于 μ 的置信度为 1−α 的置信区间的长度,求 E(L2).
解 取 T=SXˉ−μn,则 T∼t(n−1).
由 P{∣T∣<t2α(n−1)}=1−α 可得 μ 的 1−α 置信区间为
(Xˉ−t2α(n−1)⋅nS,Xˉ+t2α(n−1)⋅nS),
易见区间长度 L=2t2α(n−1)⋅nS,
故 E(L2)=E[4t2α2(n−1)⋅nS2]=n4t2α2(n−1)⋅σ2.
【4.36】假定到某地旅游的一个游客的消费额 X 服从正态分布 N(μ,σ2),且 σ=500, μ 未知. 要对平均消费额 μ 进行估计,使这个估计的绝对误差小于 50 元,且置信度不小于 0.95, 问至少需要随机调查多少个游客?
解 本题是求样本容量的最小值,因此,不妨设 X1,X2,⋯,Xn 是取自该总体的样本. 样本均值为 Xˉ,且已知 μ=Xˉ,依题意,即可由 P{Xˉ−μ<50}≥0.95 去求最小样本容量.
设 n 为需要调查的游客人数,要使
P{Xˉ−μ<50}≥0.95, 即 P{nσXˉ−μ<nσ50}≥0.95,
因为 nσXˉ−μ=U∼N(0,1),由 P{∣U∣<u2α}=1−α=0.95,其中 α=0.05,得
nσ50≥u20.05⇒n≥501.96σ⇒n≥(501.96σ)2=(501.96×500)2=384.16.
这就是随机调查游客人数不少于 385 人,就有不小于 0.95 的把握,使得用调查所得的 xˉ 去估计平均消费额的真相 μ,其绝对误差小于 50 元.