概率统计习题解答
一、选择题(共10题,每题4分,共40分)
1. 设 A , B 为两个随机事件,且 P ( A ) = P ( B ) = 3 1 , P ( A B ) = 6 1 ,则 A , B 中恰有一个事件发生的概率为( C ).
(A) 3 2 (B) 2 1 (C) 3 1 (D) 4 1
解答步骤与解释:
事件 A , B 中恰有一个发生可以表示为 ( A ∩ B c ) ∪ ( A c ∩ B ) ,或者表示为 ( A ∪ B ) ∖ ( A ∩ B ) 。
A , B 中恰有一个事件发生的概率 P 1 为:
P 1 = P ( A ∩ B c ) + P ( A c ∩ B )
我们知道 P ( A ∩ B c ) = P ( A ) − P ( A ∩ B ) 且 P ( A c ∩ B ) = P ( B ) − P ( A ∩ B ) 。
所以,P 1 = ( P ( A ) − P ( A ∩ B )) + ( P ( B ) − P ( A ∩ B ))
P 1 = P ( A ) + P ( B ) − 2 P ( A ∩ B )
代入已知值:
P 1 = 3 1 + 3 1 − 2 ⋅ 6 1 = 3 2 − 3 1 = 3 1
答案:(C)
2. 某人向同一目标独立重复射击, 每次射击命中目标的概率为 p ( 0 < p < 1 ) , 则此人第4次射击恰好是第2次命中目标的概率为( )。
(无选项给出,推导结果)
解答步骤与解释:
这是一个负二项分布问题。事件“第4次射击恰好是第2次命中目标”意味着:
在前3次射击中,恰好有1次命中目标。
第4次射击命中目标。
前3次射击中恰好有1次命中的概率(二项分布):
P ( 前 3 次中 1 次命中 ) = C 3 1 p 1 ( 1 − p ) 3 − 1 = 3 p ( 1 − p ) 2
第4次射击命中目标的概率为 p 。
由于各次射击是独立的,所求概率为:
P = P ( 前 3 次中 1 次命中 ) × P ( 第 4 次命中 )
P = 3 p ( 1 − p ) 2 ⋅ p = 3 p 2 ( 1 − p ) 2
答案:3 p 2 ( 1 − p ) 2
3. 设二维随机变量 ( X , Y ) 的概率密度为 f ( x , y ) = { 2 − x − y , 0 , 0 < x < 1 , 0 < y < 1 其他 ,则 P { X > 2 Y } = ( A ) 。
(A) 24 7 (B) 12 5 (C) 32 11 (D) 13 6
解答步骤与解释:
我们需要计算积分 ∬ D f ( x , y ) d x d y ,其中区域 D 由条件 0 < x < 1 , 0 < y < 1 和 x > 2 y 定义。
确定积分区域:
从 x > 2 y ,我们得到 y < x /2 。
由于 x < 1 ,则 y < 1/2 。
所以 y 的范围是 0 < y < 1/2 。
对于给定的 y , x 的范围是 2 y < x < 1 。
计算积分:
P ( X > 2 Y ) = ∫ 0 1/2 ∫ 2 y 1 ( 2 − x − y ) d x d y
先对 x 积分:
∫ 2 y 1 ( 2 − x − y ) d x = [ 2 x − 2 x 2 − y x ] 2 y 1
= ( 2 ( 1 ) − 2 1 2 − y ( 1 ) ) − ( 2 ( 2 y ) − 2 ( 2 y ) 2 − y ( 2 y ) )
= ( 2 − 2 1 − y ) − ( 4 y − 2 4 y 2 − 2 y 2 )
= ( 2 3 − y ) − ( 4 y − 2 y 2 − 2 y 2 ) = 2 3 − y − 4 y + 4 y 2 = 2 3 − 5 y + 4 y 2
再对 y 积分:
∫ 0 1/2 ( 2 3 − 5 y + 4 y 2 ) d y = [ 2 3 y − 2 5 y 2 + 3 4 y 3 ] 0 1/2
= ( 2 3 ⋅ 2 1 − 2 5 ⋅ ( 2 1 ) 2 + 3 4 ⋅ ( 2 1 ) 3 ) − 0
= 4 3 − 2 5 ⋅ 4 1 + 3 4 ⋅ 8 1 = 4 3 − 8 5 + 6 1
= 24 18 − 15 + 4 = 24 7
答案:(A)
4. 设随机变量X与Y相互独立且同分布,且 P { X = − 1 } = P { X = 1 } = 0.5 ,则 P { X = Y } = ( A ) 。
(A) 2 1 (B) 4 3 (C) 4 1 (D) 8 1
解答步骤与解释:
事件 X = Y 可以发生于以下两种互斥情况:
所以,P ( X = Y ) = P ( X = − 1 , Y = − 1 ) + P ( X = 1 , Y = 1 ) 。
因为 X 和 Y 相互独立:
P ( X = Y ) = P ( X = − 1 ) P ( Y = − 1 ) + P ( X = 1 ) P ( Y = 1 ) 。
因为 X 和 Y 同分布,所以 P ( Y = − 1 ) = P ( X = − 1 ) = 0.5 且 P ( Y = 1 ) = P ( X = 1 ) = 0.5 。
代入概率值:
P ( X = Y ) = ( 0.5 ) ( 0.5 ) + ( 0.5 ) ( 0.5 ) = 0.25 + 0.25 = 0.5 。
答案:(A)
5. 设随机变量 X 与 Y 相互独立,且 X ∼ B ( 1 , p ) , Y ∼ B ( 2 , p ) , 0 < p < 1 , 则 X + Y 与 X − Y 的相关系数为( )。
(无选项给出,推导结果)
解答步骤与解释:
相关系数 ρ ( U , V ) = Va r ( U ) Va r ( V ) C o v ( U , V ) ,其中 U = X + Y , V = X − Y 。
计算期望和方差:
X ∼ B ( 1 , p ) ⟹ E ( X ) = p , Va r ( X ) = p ( 1 − p ) 。
Y ∼ B ( 2 , p ) ⟹ E ( Y ) = 2 p , Va r ( Y ) = 2 p ( 1 − p ) 。
计算 Va r ( U ) 和 Va r ( V ) :
Va r ( U ) = Va r ( X + Y ) 。由于 X , Y 独立, Va r ( X + Y ) = Va r ( X ) + Va r ( Y ) = p ( 1 − p ) + 2 p ( 1 − p ) = 3 p ( 1 − p ) 。
Va r ( V ) = Va r ( X − Y ) 。由于 X , Y 独立, Va r ( X − Y ) = Va r ( X ) + Va r ( − Y ) = Va r ( X ) + ( − 1 ) 2 Va r ( Y ) = Va r ( X ) + Va r ( Y ) = 3 p ( 1 − p ) 。
计算 C o v ( U , V ) :
C o v ( U , V ) = C o v ( X + Y , X − Y )
= C o v ( X , X ) − C o v ( X , Y ) + C o v ( Y , X ) − C o v ( Y , Y )
= Va r ( X ) − C o v ( X , Y ) + C o v ( X , Y ) − Va r ( Y )
由于 X , Y 独立, C o v ( X , Y ) = 0 。
C o v ( U , V ) = Va r ( X ) − Va r ( Y ) = p ( 1 − p ) − 2 p ( 1 − p ) = − p ( 1 − p ) 。
计算相关系数:
ρ ( U , V ) = 3 p ( 1 − p ) ⋅ 3 p ( 1 − p ) − p ( 1 − p ) = 3 p ( 1 − p ) − p ( 1 − p ) 。
因为 0 < p < 1 , p ( 1 − p ) = 0 。
ρ ( U , V ) = − 3 1 。
答案:− 3 1
6. 设随机变量序列 X 1 , X 2 , … , X n 独立同分布,且 X 1 的概率密度为 f ( x ) = { 1 − ∣ x ∣ , 0 , ∣ x ∣ < 1 其他 。当 n → ∞ 时,n 1 ∑ i = 1 n X i 2 依概率收敛于 ( B )。
(A) 8 1 (B) 6 1 (C) 3 1 (D) 2 1
解答步骤与解释:
根据大数定律,若 Y i = X i 2 独立同分布,则 n 1 ∑ i = 1 n Y i 依概率收敛于 E ( Y 1 ) = E ( X 1 2 ) 。
计算 E ( X 1 2 ) :
E ( X 1 2 ) = ∫ − ∞ ∞ x 2 f ( x ) d x = ∫ − 1 1 x 2 ( 1 − ∣ x ∣ ) d x 。
由于被积函数 x 2 ( 1 − ∣ x ∣ ) 是偶函数:
E ( X 1 2 ) = 2 ∫ 0 1 x 2 ( 1 − x ) d x = 2 ∫ 0 1 ( x 2 − x 3 ) d x
= 2 [ 3 x 3 − 4 x 4 ] 0 1 = 2 ( 3 1 − 4 1 ) = 2 ( 12 4 − 3 ) = 2 ⋅ 12 1 = 6 1 。
答案:(B)
7. 设 ( X 1 , X 2 , … , X n ) 为总体 N ( 1 , 4 ) 的一个样本,X ˉ 为样本均值,则下列结论中正确的是( D )。
(A) 2/ n X ˉ − 1 ∼ t ( n )
(B) 4 1 ∑ i = 1 n ( X i − 1 ) 2 ∼ χ 2 ( n − 1 )
(C) 2 / n X ˉ − 1 ∼ N ( 0 , 1 )
(D) 4 1 ∑ i = 1 n ( X i − X ˉ ) 2 ∼ χ 2 ( n − 1 )
解答步骤与解释:
总体 X ∼ N ( μ , σ 2 ) ,其中 μ = 1 , σ 2 = 4 ⟹ σ = 2 。
分析选项:
(A) σ / n X ˉ − μ ∼ N ( 0 , 1 ) 。这里 σ 已知,所以 2/ n X ˉ − 1 ∼ N ( 0 , 1 ) ,而不是 t ( n ) 分布。t 分布是在 σ 未知并用样本标准差 S 替代时使用。故 (A) 错误。
(B) 若 X i ∼ N ( μ , σ 2 ) ,则 ∑ i = 1 n ( σ X i − μ ) 2 ∼ χ 2 ( n ) 。
这里 ∑ i = 1 n ( 2 X i − 1 ) 2 = 4 1 ∑ i = 1 n ( X i − 1 ) 2 ∼ χ 2 ( n ) 。故 (B) 错误(自由度应为 n )。
(C) X ˉ ∼ N ( μ , σ 2 / n ) = N ( 1 , 4/ n ) 。标准化后应为 2/ n X ˉ − 1 ∼ N ( 0 , 1 ) 。分母是 2 / n 不正确。故 (C) 错误。
(D) 我们知道 σ 2 ( n − 1 ) S 2 ∼ χ 2 ( n − 1 ) ,其中 S 2 = n − 1 1 ∑ i = 1 n ( X i − X ˉ ) 2 是样本方差。
所以 σ 2 ( n − 1 ) n − 1 1 ∑ i = 1 n ( X i − X ˉ ) 2 = σ 2 1 ∑ i = 1 n ( X i − X ˉ ) 2 ∼ χ 2 ( n − 1 ) 。
代入 σ 2 = 4 ,得到 4 1 ∑ i = 1 n ( X i − X ˉ ) 2 ∼ χ 2 ( n − 1 ) 。故 (D) 正确。
答案:(D)
8. 设总体 X 服从区间 [ θ , 2 θ ] (θ > 0 ) 上的均匀分布, ( X 1 , X 2 , … , X n ) 是取自总体 X 的样本, 那么 θ 的矩估计量 θ ^ M 是( B )。
(A) 2 1 X ˉ (B) 3 2 X ˉ (C) 4 3 X ˉ (D) 5 4 X ˉ
解答步骤与解释:
对于均匀分布 U [ a , b ] ,其期望为 E ( X ) = 2 a + b 。
在此题中,a = θ , b = 2 θ ,所以 E ( X ) = 2 θ + 2 θ = 2 3 θ 。
矩估计法通过令总体矩等于相应的样本矩来估计参数。这里用一阶矩:
E ( X ) = X ˉ (样本均值)。
所以,2 3 θ = X ˉ 。
解出 θ 的矩估计量 θ ^ M :
θ ^ M = 3 2 X ˉ 。
答案:(B)
9. 设 X 1 , X 2 为来自总体 N ( 0 , σ 2 ) 的简单随机样本, 其中 σ ( σ > 0 ) 是未知参数。若 σ ^ = a ∣ X 1 + X 2 ∣ 为 σ 的无偏估计, 则 a = ( A ) 。
(A) 2 π (B) 3 π (C) 4 π (D) π
解答步骤与解释:
σ ^ 是 σ 的无偏估计意味着 E ( σ ^ ) = σ 。
令 Y = X 1 + X 2 。由于 X 1 , X 2 独立且 X i ∼ N ( 0 , σ 2 ) :
E ( Y ) = E ( X 1 ) + E ( X 2 ) = 0 + 0 = 0 。
Va r ( Y ) = Va r ( X 1 ) + Va r ( X 2 ) = σ 2 + σ 2 = 2 σ 2 。
所以 Y ∼ N ( 0 , 2 σ 2 ) 。令 σ Y 2 = 2 σ 2 , 则 σ Y = 2 σ 。
我们需要计算 E ( σ ^ ) = E ( a ∣ Y ∣ ) = a E ( ∣ Y ∣ ) 。
对于一个正态分布 W ∼ N ( 0 , τ 2 ) ,有 E ( ∣ W ∣ ) = π 2 τ 。
这里 Y ∼ N ( 0 , σ Y 2 ) ,所以 E ( ∣ Y ∣ ) = π 2 σ Y = π 2 ( 2 σ ) = π 2 σ 。
因此,E ( σ ^ ) = a ⋅ π 2 σ 。
因为 σ ^ 是 σ 的无偏估计,E ( σ ^ ) = σ :
a π 2 σ = σ 。
解出 a :
a = 2 π 。
答案:(A)
10. 随机变量 X 的分布律为 P ( X = k ) = 2 k 1 , k = 1 , 2 , … 。 Y 为 X 被3除的余数,则 E ( Y ) = ( C ) 。
(A) 6 5 (B) 12 7 (C) 7 8 (D) 14 5
解答步骤与解释:
Y = X ( mod 3 ) 。Y 的可能取值为 0 , 1 , 2 。
计算 P ( Y = y ) :
P ( Y = 1 ) = P ( X = 1 ) + P ( X = 4 ) + P ( X = 7 ) + ⋯ = ∑ m = 0 ∞ P ( X = 3 m + 1 )
= ∑ m = 0 ∞ 2 3 m + 1 1 = 2 1 ∑ m = 0 ∞ ( 8 1 ) m = 2 1 ⋅ 1 − 1/8 1 = 2 1 ⋅ 7 8 = 7 4 。
P ( Y = 2 ) = P ( X = 2 ) + P ( X = 5 ) + P ( X = 8 ) + ⋯ = ∑ m = 0 ∞ P ( X = 3 m + 2 )
= ∑ m = 0 ∞ 2 3 m + 2 1 = 4 1 ∑ m = 0 ∞ ( 8 1 ) m = 4 1 ⋅ 1 − 1/8 1 = 4 1 ⋅ 7 8 = 7 2 。
P ( Y = 0 ) = P ( X = 3 ) + P ( X = 6 ) + P ( X = 9 ) + ⋯ = ∑ m = 0 ∞ P ( X = 3 m + 3 )
= ∑ m = 0 ∞ 2 3 m + 3 1 = 8 1 ∑ m = 0 ∞ ( 8 1 ) m = 8 1 ⋅ 1 − 1/8 1 = 8 1 ⋅ 7 8 = 7 1 。
(检验: 7 4 + 7 2 + 7 1 = 7 7 = 1 )
计算 E ( Y ) :
E ( Y ) = ∑ y ⋅ P ( Y = y ) = 0 ⋅ P ( Y = 0 ) + 1 ⋅ P ( Y = 1 ) + 2 ⋅ P ( Y = 2 )
E ( Y ) = 0 ⋅ 7 1 + 1 ⋅ 7 4 + 2 ⋅ 7 2 = 7 4 + 7 4 = 7 8 。
答案:(C)
二、(10分)有 a , b , c 三个盒子, a 盒中有4个白球和2个黑球, b 盒中有2个白球和1个黑球, c 盒中有3个白球和3个黑球。今掷一颗骰子以决定选盒。若出现1, 2, 3点则选 a 盒, 若出现4点, 则选 b 盒, 若出现5,6点则选 c 盒。在选出的盒中任取一球。
(1) 求取出白球的概率;
(2) 若取出的是白球,那么此球来自 c 盒的概率。
(注:最后结果可以是小数或者分数,但分数不能四舍五入写成小数)
解答步骤与解释:
定义事件:
A : 选到 a 盒
B : 选到 b 盒
C : 选到 c 盒
W : 取出白球
确定选盒概率:
P ( A ) = 6 3 = 2 1 (骰子出现1, 2, 3点)
P ( B ) = 6 1 (骰子出现4点)
P ( C ) = 6 2 = 3 1 (骰子出现5, 6点)
确定各盒中取到白球的条件概率:
P ( W ∣ A ) = a 盒中总球数 a 盒中白球数 = 4 + 2 4 = 6 4 = 3 2
P ( W ∣ B ) = b 盒中总球数 b 盒中白球数 = 2 + 1 2 = 3 2
P ( W ∣ C ) = c 盒中总球数 c 盒中白球数 = 3 + 3 3 = 6 3 = 2 1
(1) 求取出白球的概率 P ( W ) :
根据全概率公式:
P ( W ) = P ( W ∣ A ) P ( A ) + P ( W ∣ B ) P ( B ) + P ( W ∣ C ) P ( C )
P ( W ) = ( 3 2 ) ⋅ ( 2 1 ) + ( 3 2 ) ⋅ ( 6 1 ) + ( 2 1 ) ⋅ ( 3 1 )
P ( W ) = 3 1 + 18 2 + 6 1 = 3 1 + 9 1 + 6 1
P ( W ) = 18 6 + 18 2 + 18 3 = 18 6 + 2 + 3 = 18 11
(2) 若取出的是白球,那么此球来自 c 盒的概率 P ( C ∣ W ) :
根据贝叶斯公式:
P ( C ∣ W ) = P ( W ) P ( W ∣ C ) P ( C )
P ( C ∣ W ) = 18 11 ( 2 1 ) ⋅ ( 3 1 )
P ( C ∣ W ) = 18 11 6 1 = 6 1 ⋅ 11 18 = 11 3
答案:
(1) 取出白球的概率为 18 11 。
(2) 若取出的是白球,此球来自 c 盒的概率为 11 3 。
三、(10分)设供电站供应某地区1200户居民用电,各户用电情况相互独立。已知每户每天用电量(单位:度)在[0,20]上服从均匀分布。现要以0.99的概率满足该地区居民供应电量的需求,问供电站每天至少需向该地区供应多少度电?(附: )
**(注:通常题目会附上标准正态分布表的相关值,如 Φ ( 2.326 ) ≈ 0.99 或 z 0.01 = 2.326 。此处假设 z 0.99 ,即满足 Φ ( z 0.99 ) = 0.99 的值为 2.326 。) **
解答步骤与解释:
单户用电量分布:
设 X i 为第 i 户居民的日用电量,X i ∼ U [ 0 , 20 ] 。
期望 E ( X i ) = 2 0 + 20 = 10 度。
方差 Va r ( X i ) = 12 ( 20 − 0 ) 2 = 12 400 = 3 100 (度2 )。
总用电量:
设 S N = ∑ i = 1 N X i 为 N = 1200 户居民的总日用电量。
期望 E ( S N ) = N ⋅ E ( X i ) = 1200 ⋅ 10 = 12000 度。
方差 Va r ( S N ) = N ⋅ Va r ( X i ) (因为各户独立) = 1200 ⋅ 3 100 = 400 ⋅ 100 = 40000 (度2 )。
标准差 σ S N = Va r ( S N ) = 40000 = 200 度。
应用中心极限定理 (CLT):
由于 N = 1200 较大,根据中心极限定理,S N 近似服从正态分布 N ( E ( S N ) , Va r ( S N )) ,即 S N ≈ N ( 12000 , 40000 ) 。
求解供电量:
设供电站每天至少需向该地区供应 K 度电。我们需要满足 P ( S N ≤ K ) = 0.99 。
标准化 S N :
P ( σ S N S N − E ( S N ) ≤ 200 K − 12000 ) = 0.99
令 Z = 200 S N − 12000 ,则 Z ∼ N ( 0 , 1 ) 。
P ( Z ≤ 200 K − 12000 ) = 0.99
设 z 0.99 是标准正态分布的0.99分位数,即 Φ ( z 0.99 ) = 0.99 。通常 z 0.99 ≈ 2.326 。
所以,200 K − 12000 = z 0.99 。
200 K − 12000 = 2.326
K = 12000 + 200 ⋅ 2.326
K = 12000 + 465.2 = 12465.2 度。
答案:
供电站每天至少需向该地区供应 12465.2 度电,才能以0.99的概率满足需求(假设 Φ ( 2.326 ) = 0.99 )。
四、(10分)某次考试学生的考试成绩 X 服从正态分布 N ( μ , σ 2 ) , 其中 μ , σ 2 均未知。现从中随意抽取容量为25的一个样本, 测得样本均值 x ˉ = 66.5 , 样本修正方差 s 2 (注:题目中未给出 s 2 的具体值)。
(1) 求总体方差 σ 2 的置信度为 0.90 的置信区间; (注:(1)小题结果就用分位数表示)
(2) 在显著性水平 α = 0.05 下,检验是否可以认为这次考试的平均成绩为70分. (附:t 0.95 ( 24 ) = 1.7109 , t 0.95 ( 25 ) = 1.7081 , t 0.975 ( 24 ) = 2.0639 , t 0.975 ( 25 ) = 2.0595 )
解答步骤与解释:
(1) 求总体方差 σ 2 的置信度为 0.90 的置信区间:
已知条件:
样本容量 n = 25
置信度 1 − α = 0.90 ⟹ α = 0.10 ⟹ α /2 = 0.05
自由度 df = n − 1 = 24
置信区间公式:
σ 2 的 1 − α 置信区间为:
( χ α /2 , n − 1 2 ( n − 1 ) s 2 , χ 1 − α /2 , n − 1 2 ( n − 1 ) s 2 )
其中 χ α /2 , n − 1 2 是卡方分布的上 α /2 分位数,χ 1 − α /2 , n − 1 2 是卡方分布的下 α /2 分位数 (或者说上 1 − α /2 分位数)。
代入数值(用分位数表示):
α /2 = 0.05 , 1 − α /2 = 0.95 。
置信区间为:
( χ 0.05 , 24 2 24 s 2 , χ 0.95 , 24 2 24 s 2 )
(注:这里的 s 2 是样本修正方差,题目中未给出其具体值。)
(2) 在显著性水平 α = 0.05 下,检验是否可以认为这次考试的平均成绩为70分:
建立假设:
原假设 H 0 : μ = 70
备择假设 H 1 : μ = 70 (双边检验)
检验统计量:
由于 σ 2 未知,使用 t 统计量:
t = s / n x ˉ − μ 0
其中 x ˉ = 66.5 , μ 0 = 70 , n = 25 。s = s 2 是样本标准差。
显著性水平和临界值:
显著性水平 α = 0.05 。
自由度 df = n − 1 = 24 。
对于双边检验,临界值为 ± t α /2 , n − 1 = ± t 0.025 , 24 。
题目中给出 t 0.975 ( 24 ) = 2.0639 。这表示 P ( T 24 < 2.0639 ) = 0.975 ,所以 P ( T 24 > 2.0639 ) = 0.025 。
因此,上临界值为 t 0.025 , 24 = 2.0639 。拒绝域为 ∣ t ∣ > 2.0639 。
计算检验统计量的值:
t = s / 25 66.5 − 70 = s /5 − 3.5 = s − 17.5 。
(注:由于题目未给出样本修正方差 s 2 (或样本标准差 s ) 的值,我们无法计算出 t 的确切值。)
决策:
如果计算得到的 ∣ t o b ser v e d ∣ > 2.0639 ,则拒绝 H 0 。
如果计算得到的 ∣ t o b ser v e d ∣ ≤ 2.0639 ,则不拒绝 H 0 。
例如,如果假设 s 2 = 100 ,则 s = 10 。
t = 10 − 17.5 = − 1.75 。
∣ t ∣ = ∣ − 1.75∣ = 1.75 。
因为 1.75 ≤ 2.0639 ,所以不拒绝 H 0 。这种情况下,不能认为这次考试的平均成绩不是70分。
但由于 s 2 未知,我们只能给出决策规则。
答案:
(1) σ 2 的 0.90 置信区间为 ( χ 0.05 , 24 2 24 s 2 , χ 0.95 , 24 2 24 s 2 ) ,其中 s 2 为样本修正方差。
(2) 检验步骤如上。决策依赖于未知的样本修正方差 s 2 。检验统计量为 t = s − 17.5 。若 ∣ t ∣ > 2.0639 ,则拒绝 H 0 ,认为平均成绩不是70分;否则不拒绝 H 0 。
五、(10分)设总体 X 的密度函数是 f ( x ; θ ) = 2 θ 1 e − θ ∣ x ∣ ,其中 θ > 0 是参数。样本 X 1 , X 2 , … , X n 来自总体 X 。
(1) 求 θ 的最大似然估计 θ ^ L ;
(2) 证明 θ ^ L 是 θ 的相合估计。
解答步骤与解释:
(1) 求 θ 的最大似然估计 θ ^ L :
似然函数 L ( θ ) :
L ( θ ) = ∏ i = 1 n f ( X i ; θ ) = ∏ i = 1 n 2 θ 1 e − θ ∣ X i ∣ = ( 2 θ 1 ) n e − θ 1 ∑ i = 1 n ∣ X i ∣
对数似然函数 ln L ( θ ) :
ln L ( θ ) = n ln ( 2 θ 1 ) − θ 1 ∑ i = 1 n ∣ X i ∣
= n ( ln 1 − ln ( 2 θ )) − θ 1 ∑ i = 1 n ∣ X i ∣
= − n ln 2 − n ln θ − θ 1 ∑ i = 1 n ∣ X i ∣
求导并令其为0:
d θ d ln L ( θ ) = − n ⋅ θ 1 − ( − θ 2 1 ) ∑ i = 1 n ∣ X i ∣ = − θ n + θ 2 1 ∑ i = 1 n ∣ X i ∣
令 d θ d ln L ( θ ) = 0 :
− θ n + θ 2 1 ∑ i = 1 n ∣ X i ∣ = 0
乘以 θ 2 (因为 θ > 0 ):
− n θ + ∑ i = 1 n ∣ X i ∣ = 0
n θ = ∑ i = 1 n ∣ X i ∣
θ ^ L = n 1 ∑ i = 1 n ∣ X i ∣
验证是极大值点(二阶导数):
d θ 2 d 2 ln L ( θ ) = θ 2 n − θ 3 2 ∑ i = 1 n ∣ X i ∣
在 θ = θ ^ L 处,即 ∑ i = 1 n ∣ X i ∣ = n θ ^ L :
d θ 2 d 2 ln L ( θ ) θ = θ ^ L = θ ^ L 2 n − θ ^ L 3 2 n θ ^ L = θ ^ L 2 n − θ ^ L 2 2 n = − θ ^ L 2 n
由于 n > 0 且 θ ^ L > 0 (因为 θ > 0 且数据非平凡时 ∣ X i ∣ 不全为0),所以 − θ ^ L 2 n < 0 。因此,θ ^ L 是极大值点。
(2) 证明 θ ^ L 是 θ 的相合估计:
相合估计的定义:
如果估计量序列 θ ^ n 当 n → ∞ 时依概率收敛于参数 θ (即 θ ^ n P θ ),则称 θ ^ n 是 θ 的相合估计。
应用大数定律:
令 Y i = ∣ X i ∣ 。由于 X 1 , … , X n 是来自总体 X 的独立同分布样本,所以 Y 1 , … , Y n 也是独立同分布的。
根据辛钦大数定律,样本均值依概率收敛于期望值:
θ ^ L = n 1 ∑ i = 1 n ∣ X i ∣ P E ( ∣ X 1 ∣ ) 当 n → ∞ 。
计算 E ( ∣ X ∣ ) :
E ( ∣ X ∣ ) = ∫ − ∞ ∞ ∣ x ∣ f ( x ; θ ) d x = ∫ − ∞ ∞ ∣ x ∣ 2 θ 1 e − θ ∣ x ∣ d x
由于被积函数是偶函数:
E ( ∣ X ∣ ) = 2 ∫ 0 ∞ x ⋅ 2 θ 1 e − θ x d x = θ 1 ∫ 0 ∞ x e − θ x d x
这是一个 Gamma 分布相关的积分,或者指数分布的期望。令 λ = 1/ θ ,积分 ∫ 0 ∞ x λ e − λ x d x 是 E x p ( λ ) 分布的期望,等于 1/ λ = θ 。
或者通过分部积分:令 u = x , d v = e − x / θ d x ⟹ d u = d x , v = − θ e − x / θ
∫ 0 ∞ x e − θ x d x = [ − x θ e − θ x ] 0 ∞ − ∫ 0 ∞ ( − θ ) e − θ x d x
= ( 0 − 0 ) + θ ∫ 0 ∞ e − θ x d x = θ [ − θ e − θ x ] 0 ∞
= θ ( 0 − ( − θ )) = θ 2
所以,E ( ∣ X ∣ ) = θ 1 ⋅ θ 2 = θ 。
结论:
由于 θ ^ L P E ( ∣ X 1 ∣ ) 且 E ( ∣ X 1 ∣ ) = θ ,因此 θ ^ L P θ 。
所以,θ ^ L 是 θ 的相合估计。
答案:
(1) θ 的最大似然估计为 θ ^ L = n 1 ∑ i = 1 n ∣ X i ∣ 。
(2) 证明如上,θ ^ L 是 θ 的相合估计。
六、(10分)已知随机变量 X , Y 相互独立, 且 X 的概率分布为: P ( X = 1 ) = P ( X = − 1 ) = 2 1 。Y 服从参数为 λ 的泊松分布 ( λ > 0 ) , Z = X Y .
(1) 求 C o v ( X , Z ) ;
(2) 求 Z 的分布律.
解答步骤与解释:
(1) 求 C o v ( X , Z ) :
C o v ( X , Z ) 的定义:
C o v ( X , Z ) = E ( XZ ) − E ( X ) E ( Z ) 。
计算 E ( X ) :
E ( X ) = ( 1 ) ⋅ P ( X = 1 ) + ( − 1 ) ⋅ P ( X = − 1 ) = 1 ⋅ 2 1 + ( − 1 ) ⋅ 2 1 = 0 。
由于 E ( X ) = 0 , C o v ( X , Z ) = E ( XZ ) 。
计算 E ( XZ ) :
E ( XZ ) = E ( X ⋅ X Y ) = E ( X 2 Y ) 。
计算 E ( X 2 ) :
E ( X 2 ) = ( 1 ) 2 ⋅ P ( X = 1 ) + ( − 1 ) 2 ⋅ P ( X = − 1 ) = 1 ⋅ 2 1 + 1 ⋅ 2 1 = 1 。
计算 E ( Y ) :
Y ∼ P o i sso n ( λ ) , 所以 E ( Y ) = λ 。
由于 X 和 Y 相互独立,则 X 2 和 Y 也相互独立。
所以 E ( X 2 Y ) = E ( X 2 ) E ( Y ) = 1 ⋅ λ = λ 。
因此,C o v ( X , Z ) = λ 。
(2) 求 Z 的分布律:
Z = X Y 。X 的取值为 { − 1 , 1 } ,Y 的取值为 { 0 , 1 , 2 , … } 。
因此 Z 的取值可以为 { 0 , ± 1 , ± 2 , … } 。
P ( Z = 0 ) :
Z = 0 ⟺ X Y = 0 。因为 P ( X = 0 ) = 0 , 所以 X Y = 0 ⟺ Y = 0 。
P ( Z = 0 ) = P ( Y = 0 ) 。
对于泊松分布 P ( Y = k ) = k ! e − λ λ k 。
P ( Z = 0 ) = P ( Y = 0 ) = 0 ! e − λ λ 0 = e − λ 。
P ( Z = k ) for k ∈ { 1 , 2 , 3 , … } (即 k > 0 ):
Z = k ⟺ X Y = k .
如果 X = 1 , 则 Y = k .
如果 X = − 1 , 则 Y = − k . 但 Y 不能为负,所以此情况概率为0。
P ( Z = k ) = P ( X = 1 , Y = k ) 。由于 X , Y 独立,
P ( Z = k ) = P ( X = 1 ) P ( Y = k ) = 2 1 ⋅ k ! e − λ λ k 。
P ( Z = k ) for k ∈ { − 1 , − 2 , − 3 , … } (即 k < 0 ):
令 k = − j where j ∈ { 1 , 2 , 3 , … } .
Z = − j ⟺ X Y = − j .
如果 X = 1 , 则 Y = − j . 但 Y 不能为负,所以此情况概率为0。
如果 X = − 1 , 则 Y = j .
P ( Z = − j ) = P ( X = − 1 , Y = j ) 。由于 X , Y 独立,
P ( Z = − j ) = P ( X = − 1 ) P ( Y = j ) = 2 1 ⋅ j ! e − λ λ j 。
Z 的分布律总结:
P ( Z = k ) = ⎩ ⎨ ⎧ e − λ 2 1 k ! e − λ λ k 2 1 ( − k )! e − λ λ − k if k = 0 if k ∈ { 1 , 2 , 3 , … } if k ∈ { − 1 , − 2 , − 3 , … }
或者可以写作:
P ( Z = 0 ) = e − λ
P ( Z = k ) = 2 1 ∣ k ∣ ! e − λ λ ∣ k ∣ for k ∈ Z ∖ { 0 } .
答案:
(1) C o v ( X , Z ) = λ 。
(2) Z 的分布律为:
P ( Z = 0 ) = e − λ
P ( Z = k ) = 2 1 ∣ k ∣ ! e − λ λ ∣ k ∣ , 对于 k = ± 1 , ± 2 , …
七、(10分)设随机变量 X 和 Y 相互独立,X 服从参数为1的指数分布,Y 服从参数为2的指数分布, V = min ( X , 2 Y ) , U = max ( X , 2 Y ) . 求
(1) 随机变量 V 的概率密度;
(2) C o v ( U , V ) .
解答步骤与解释:
随机变量的分布:
X ∼ E x p ( 1 ) : f X ( x ) = e − x for x > 0 , F X ( x ) = 1 − e − x for x > 0 .
E ( X ) = 1/1 = 1 , Va r ( X ) = 1/ 1 2 = 1 .
Y ∼ E x p ( 2 ) : f Y ( y ) = 2 e − 2 y for y > 0 , F Y ( y ) = 1 − e − 2 y for y > 0 .
W = 2 Y 的分布:
F W ( w ) = P ( W ≤ w ) = P ( 2 Y ≤ w ) = P ( Y ≤ w /2 ) = F Y ( w /2 )
For w /2 > 0 ⟹ w > 0 :
F W ( w ) = 1 − e − 2 ( w /2 ) = 1 − e − w for w > 0 .
所以 W ∼ E x p ( 1 ) 。 f W ( w ) = e − w for w > 0 .
E ( W ) = E ( 2 Y ) = 2 E ( Y ) = 2 ( 1/2 ) = 1 . Va r ( W ) = Va r ( 2 Y ) = 2 2 Va r ( Y ) = 4 ( 1/ 2 2 ) = 1 .
由于 X , Y 独立, X 和 W = 2 Y 也独立。
(1) 随机变量 V = min ( X , W ) 的概率密度:
V 的分布函数 F V ( v ) :
F V ( v ) = P ( V ≤ v ) = 1 − P ( V > v ) .
P ( V > v ) = P ( min ( X , W ) > v ) = P ( X > v and W > v ) .
由于 X , W 独立:
P ( V > v ) = P ( X > v ) P ( W > v ) .
P ( X > v ) = 1 − F X ( v ) = e − v for v > 0 .
P ( W > v ) = 1 − F W ( v ) = e − v for v > 0 .
So, P ( V > v ) = e − v ⋅ e − v = e − 2 v for v > 0 .
F V ( v ) = 1 − e − 2 v for v > 0 .
V 的概率密度函数 f V ( v ) :
f V ( v ) = d v d F V ( v ) = d v d ( 1 − e − 2 v ) = 2 e − 2 v for v > 0 .
所以 V ∼ E x p ( 2 ) 。
(2) C o v ( U , V ) :
性质:
U = max ( X , W ) and V = min ( X , W ) .
我们有 U + V = X + W 和 U V = X W .
C o v ( U , V ) 的计算:
C o v ( U , V ) = E ( U V ) − E ( U ) E ( V ) .
E ( U V ) = E ( X W ) . 由于 X , W 独立, E ( X W ) = E ( X ) E ( W ) .
E ( X ) = 1 (since X ∼ E x p ( 1 ) ).
E ( W ) = 1 (since W ∼ E x p ( 1 ) ).
So E ( U V ) = E ( X W ) = 1 ⋅ 1 = 1 .
计算 E ( V ) :
V ∼ E x p ( 2 ) , so E ( V ) = 1/2 .
计算 E ( U ) :
E ( U + V ) = E ( X + W ) .
E ( U ) + E ( V ) = E ( X ) + E ( W ) (由于 X , W 独立, E ( X + W ) = E ( X ) + E ( W ) ).
E ( U ) + 2 1 = 1 + 1 = 2 .
E ( U ) = 2 − 2 1 = 2 3 .
代入计算 C o v ( U , V ) :
C o v ( U , V ) = E ( U V ) − E ( U ) E ( V ) = 1 − ( 2 3 ) ( 2 1 ) = 1 − 4 3 = 4 1 .
答案:
(1) 随机变量 V 的概率密度为 f V ( v ) = 2 e − 2 v for v > 0 (即 V ∼ E x p ( 2 ) )。
(2) C o v ( U , V ) = 4 1 。