D.6 Azuma 不等式
本节介绍了一个比霍夫丁不等式更一般的集中不等式。其证明利用了针对随机游走差分的霍夫丁不等式。
定义 D.5 (随机游走差分)
一列随机变量 V1,V2,… 是关于 X1,X2,… 的随机游走差分序列,如果对于所有 i>0, Vi 是 X1,…,Xi 的函数且
E[Vi+1∣X1,…,Xi]=0.(D.9)
下面的结果与霍夫丁引理相似。
引理 D.6 设 V 和 Z 是满足 E[V∣Z]=0 的随机变量,对于某个函数 f 和常数 c≥0 ,不等式:
f(Z)≤V≤f(Z)+c.(D.10)
然后,对于所有 t>0 ,以下的上界成立:
E[etV∣Z]≤et2c2/8.(D.11)
证明:证明步骤与引理 D.1 相同,只是用条件期望代替期望:在 Z,V 取值在 [a,b] 且 a=f(Z) 和 b=f(Z)+c 的条件下,其期望消失。
该引理用于证明以下定理,该定理是本节的主要结果之一。
定理 D.7(Azuma 不等式)
设 V1,V2,… 是关于随机变量 X1,X2,… 的谱,并假设对于所有 i>0 存在一个常数 ci≥0 以及随机变量 Zi ,它是 X1,…,Xi−1 的函数,满足
Zi≤Vi≤Zi+ci(D.12)
然后,对于所有 ϵ>0 和 m ,以下不等式成立:
P[i=1∑mVi≥ϵ]P[i=1∑mVi≤−ϵ]≤expi=1∑mci2−2ϵ2≤expi=1∑mci2−2ϵ2.(D.13)(D.14)
证明:对于任意 k∈[m] ,设 Sk=i=1∑kVk 。然后,使用 Chernoff 边界技术,对于任意 t>0 ,我们可以写出
P[Sm≥ϵ]≤e−tϵE[etSm]
=e−tϵE[etSm−1E[etVm∣X1,…,Xm−1]]
≤e−tϵE[etSm−1]et2cm2/8(lemma D.6)
≤e−tϵet2i=1∑mci2/8(iterating previous argument)
=e−2ϵ2/i=1∑mci2,
其中我们选择 t=4ϵ/i=1∑mci2 以最小化上界。这证明了定理的第一个陈述,第二个陈述以类似的方式证明。