在这里,我们提出了一个比 Hoeffding 不等式更精细的上界,该上界用二元相对熵表示。
定理 D. 3(Sanov 定理)设 X1,…,Xm 为独立随机变量,根据某个分布 D 抽取,具有均值 p 且支撑集包含在 [0,1] 内。那么,对于任意 q∈[0,1] ,以下不等式对 p=m1i=1∑mXi 成立:
P[p≥q]≤e−mD(q∥p)
其中 D(q∥p)=qlogpq+(1−q)log1−p1−q 是 p 和 q 的二元相对熵。
对于任意 t>0 ,由于函数 x↦etx 的凸性,以下不等式对所有 x∈[0,1]:etx=et[(1−x)⋅0+x⋅1]≤1−x+etx 成立。鉴于这一点,对于任意 t>0 ,我们可以写出
P[p≥q]=P[etmp≥etmq]
=P[etmp≥etmq]
≤e−tmqE[etmp](by Markov’s inequality)
=e−tmqE[eti=1∑mXi]
=e−tmqi=1∏mE[etXi]
≤e−tmqi=1∏mE[1−Xi+etXi](∀x∈[0,1],etx≤1−x+etx)
=[e−tq(1−p+etp)]m.
现在,函数 f:t↦e−tq(1−p+etp)=(1−p)e−tq+pet(1−q) 在 t=logp(1−q)q(1−p) 处达到最小值。将这个 t 的值代入上述不等式中得到 P[p≥q]≤e−mD(q∥p) 。□ 注意,对于任意 ϵ>0,ϵ≤1−p ,选择 q=p+ϵ ,定理暗示
P[p≥p+ϵ]≤e−mD(p+ϵ∥p).(D.6)
这是一个比Hoeffding不等式(定理D.2)更精细的界限,因为根据Pinsker不等式(命题E.7),D(p+ϵ∥p)≥21(2ϵ)2=2ϵ2 。类似地,我们可以通过对随机变量 Yi=1−Xi 应用该定理来推导一个对称的界限。然后,对于任何 ϵ>0,ϵ≤p ,在选择 q=p−ϵ 的情况下,该定理暗示
P[p≤p−ϵ]≤e−mD(p−ϵ∥p).(D.7)