第十一章 学以致用: 为什么不值得去赌场?
前面讲的故事, 主要是关于人们如何发现概率规律的。 那么, 概率到底有什么实际用处呢? 咱们还是讲故事。
1981 年 1 月 25 日, 在新奥尔良举行的第 15 届美式橄榄球超级碗 (Super Bowl) 大赛的中场休息期间, 各大电视台放送了一个非同寻常、争议巨大的广告节目。 100名普通人出现在屏幕上, 他们坐在巨大舞台的三排长长的会议桌后面, 每人面前摆着两个没有标志、颜色不同的啤酒杯。 主持这场 “伟大的美国啤酒品尝” 节目的是一位身穿比赛制服的国家橄榄球联盟专业裁判员。 他告诉品尝者, 这两杯啤酒, 一杯是安海斯-布希 (Anheiser-Busch) 啤酒酿造公司的米凯罗 (Michelob), 一杯是施利茨啤酒酿造公司 (Joseph Schlitz Brewing Company) 的施利茨。 目的是要看看哪种啤酒更受人喜爱。
施利茨是位于威斯康星州最大的城市密尔瓦基的啤酒酿造公司, 它是美国啤酒的发祥地, 也曾经业绩辉煌。 1902 年, 它是美国最大的啤酒制造商, 50 年代, 它同安海斯-布希并驾齐驱, 可是到了 70 年代, 一系列经营决策和公关的重大失误使得施利茨啤酒销量大幅降低, 公司的名誉也遭到严重损害。 同是位于密尔瓦基的米勒啤酒公司 (Miller Beer) 崛起, 一项调查显示, 在米勒与施利茨啤酒之间, 只有三分之一的人选择施利茨。 生死存亡的关头, 怎样才能从这种困境中摆脱出来呢? 施利茨找到芝加哥一家著名的广告代理商智威汤逊 (J. Walter Thompson), 它是世界上第一家广告公司, 历史悠久, 名声显赫。 智威汤逊为施利茨设计了上面的广告活动。
裁判员一声哨响, 100 名 “忠实的米凯罗啤酒爱好者” 喝下两杯啤酒, 按下桌面上的按钮, 选择自己喜爱的啤酒。 屏幕显示, 米凯罗对施利茨的选择是 50 对 50。
按照当时价格, 在超级碗期间播放电视广告的费用是每 30 秒二十七万五千美元。 一分钟的广告, 施利茨花费了五十五万美元, 大约合今天一百七十万美元, 这还不算交付智威汤逊的咨询费、在新奥尔良球场附近建造舞台、聘请裁判员以及邀请 100 名啤酒爱好者参加品尝的费用。 值得吗?智威汤逊为什么建议施利茨做这样的广告?
先看是否值得。 观众在中场休息上厕所回来的时候发现, 原来人们对施利茨跟米凯罗啤酒的喜爱度是一比一, 这正是施利茨希望人们得到的信息。 这个信息可能足以打破先前那个 “只有三分之一的人选择施利茨” 的糟糕印象, 施利茨啤酒的销量很可能因此增加。
那么, 智威汤逊为什么设计这样的广告呢? 这是一个巧妙利用概率的例子。 百年老店施利茨的啤酒当然跟米凯罗的质量不相上下, 只是在经营决策和公关问题上给顾客留下了坏印象。 我们可以相对安全地假定每个品尝者选择米凯罗或施利茨啤酒的概率都是 50%, 而且任何一个品尝者的选择都与其他品尝者无关, 那么选择米凯罗或是施利茨就跟投一枚硬币得到正面和反面在概率上是一样的。
施利茨希望打破那个 “三分之一” 的观念。 假定他们期待的这场品尝比赛得到的最坏结果是施利茨对米凯罗等于 40 对 60。 投 100 次硬币, 得到 40 次正面的概率是多少呢?从式(9.1), 我们知道
其中 。 对 , 根据第九章的知识, 我们可以画出在不同 值下的概率, 如图 11.1 中的橙色曲线。 对 , 我们得到概率 。 这是得到 “40对 60” 这个特定结果的概率。 但是, 对施利茨来讲, “41对 59”、“42对 58”等比“40对 60” 更好。 当然 “100对 0” 最好, 不过出现这种情况的概率微乎其微, 它等于 。 得到 “40对60” 以及比它更好的结果的概率是从 “40 对 60” 到 “100 对 0 ” 所有这些概率的总和, 这叫累计概率 (Cumulative probability)。 的累计概率相当于把图 11.1 中橙色曲线从 到 的橙色曲线值求和 (图 11.1 中的蓝色曲线), 也就是
这个式子看起来有点吓人, 实际上很简单。 我们知道橙色曲线关于 左右对称 (理由见第三章和第九章), 所以, 式 (11.2) 相当于把橙色曲线从 到 的概率值都加起来。 这个累计概率对应的是图 11.1 中蓝色曲线在 的值, 大致等于

图 11.1 橙色曲线是式(11.1)在不同 值情况下的概率分布曲线。 这条曲线下面的面积对应总概率 (=1)。 蓝色曲线是从 到任意一个给定 值 的累计概率, 它在 处取值 0.5。 相对于这个点, 这条曲线呈反对称性。
98%。 可以想象, 智威汤逊把这个分析拿给施利茨的总裁看, 说:“放心吧!我们有将近 100% 的把握, 100个人品尝的结果会是 50 对 50。 ” 虽然不是严格意义上的万无一失, 但达到目标的把握是相当大的。
为什么选择 100 个人? 为什么不是 10 个人? 还记得伯努利的大数原理吗? 如果对 重复上面的计算, 你会发现 4 个人 (也就是 40%) 选择施利茨啤酒的概率下降到 83%。 这个概率虽然也算是挺高的, 但是不确定因素大大增加了。 考虑到广告花费之高, 危险系数有点大。 伯努利大数定律告诉我们, 值越大, 概率预测的结果就越确定。 如果招1000人做品尝比赛, 40%选择施利茨的概率将达到 99.99999999%, 也就是万无一失。 不过这么一来花销可就大多了。
任何随机事件都具有不可预测性。 概率能告诉我们在大量的重复事件中最可能发生的结果是什么, 但不能告诉我们每一次事件会是什么样的结果。 一个人投了 100 次硬币, 得到的都是正面, 第 101 次投硬币得到反面的概率会增加吗? 这里必须搞清几个概念。 首先投硬币作为随机事件, 不论之前发生了什么情况, 下一次出现正反面的概率是不变的, 因为下一次发生的概率与之前事件无关。
其次, 连续出现 100 个正面是几乎不可能的情况, 但在几十亿人的世界, 随着时间的流逝, 几乎不可能的事件总是有发生的可能性。 概率告诉我们什么可能发生, 但不能告诉我们为什么一个具体的事件会发生。
可是直觉告诉我们, 这个人在得到 100 个正面以后, 肯定会得到一些反面。 为什么? 还是因为大数原理。 回忆一下第一章里的图 1.3 和图 1.4, 虽然克里奇每一次投掷硬币, 出现正面和反面的概率都是 1/2, 但是在投掷的过程中, 总会有连续出现好几个正面或反面的时候 (事件的随机性)。 图 1.3 和图 1.4 中的曲线在 0.5 附近上上下下来回震荡, 但随着投币次数的增加, 震荡幅度越来越低, 最终会越来越接近 0.5。 所以在连续出现很多次正面以后, 出现反面的可能性肯定会增加。 这种现象还有一个颇为唬人的名字, 叫做 “向均值回归”, 这个概念我们在下篇里会详细讨论。 不过你要是和这个人打赌, 在他得到 100 个正面以后, 千万不要把全部赌注都押在第 101 次是反面上, 因为从概率上说, 你仍然只有 50% 得到反面的机会!
这三个要素: 不同类事件之间的相关性, 同一类事件出现的概率, 每次出现某类事件的随机性, 是每一个概率分析中都必须考虑的。
再讲个故事吧。
20世纪最后十年, 英国出现了若干引人注目的婴儿猝死事件。 不满周岁, 特别是四五个月以内的婴儿在毫无征兆的情况下在睡眠中突然死亡, 通常没有任何挣扎和哭喊的迹象, 解剖也找不到死亡的原因。 而且类似的悲剧经常在同一个家庭多次发生。 英国最著名的儿科专家麦多 (Roy Meadow, 1933一) 坚信, 是婴儿的父母尤其是母亲蓄意杀害婴儿, 其潜在动机是为了寻求旁人对自己的同情和关心。 作为专家, 他多次出庭作证, 利用概率原理论证: 在同一家庭里, 一个婴儿猝死是悲剧, 两个死亡很可疑, 三个死亡肯定是谋杀。 麦多利用概率精确地表达自己的观点: 根据当时英国的统计数据, 大约每 8500 个婴儿当中会发生一例猝死事件。 换句话说, 每个初生婴儿可能猝死的概率是 1/8 500。 麦多论证说, 根据这个概率, 在同一个家庭出现第二个婴儿猝死的概率等于 。 1995 年, 英格兰的人口总数只有 4800 万。 按照麦多的计算, 两个婴儿在同一个家庭猝死的概率是 7200 万比一。 他的计算震惊了英国法院, 于是在没有其他旁证的情况下引用这个所谓的 “麦多法则” (Meadow’s law) 直接对嫌疑人判决, 致使数百名年轻父母入狱。 1998 年, 英国皇家还授予麦多骑士头衔, 以表彰他对儿童健康做出的杰出贡献。
可是, 英国皇家统计学会对 “麦多法则” 大声叫停。 一个家庭出现两次婴儿猝死的概率根本不能跟丢一个有 8500 个面的骰子得到两次相同号码的概率等同。 对后者来说, 每次丢骰子得到的结果都是相互无关的; 而对前者来说, 每个家庭的婴儿猝死则很可能是相关的。 比如由于遗传因素, 同一个家庭的婴儿都有天生柔弱的臂膀。 在西方, 传统上婴儿都趴着睡觉。 婴儿压住了口鼻, 需要翻身, 但没有力量, 只能窒息。 后来的调查发现, 确实有不少家庭连续几代都出现过婴儿猝死。 真正致死的原因至今不明, 不过后来的专家建议, 把婴儿翻过来仰面朝天入睡。 有统计数字显示, 这么一个简单的改变可以使婴儿猝死率减少大约一半。 这正是中国传统上采用的婴儿睡姿。
2004 年, 英国政府宣布对 258 个婴儿猝死案重新评估。 一个儿科专家对概率相关性的错误理解, 造成对许多家庭的重大伤害。 很多父母终生都无法从丧子、受审、判刑、入狱的重重打击中走出来。 后来麦多自己也不得不放弃行医。
现在可以讨论本书前言里关于电梯上行和下行的概率问题了。 在不同的楼层, 电梯的上行与下行并不完全是随机的。 显然, 对底层来说, 电梯下行的概率等于零。 同理, 对顶层来说, 上行的概率也等于零。 在这两层, 上行与下行不是随机而且是无关的。 其他各层, 上行与下行的概率取决于控制电梯的程序设计, 只有在一幢楼里存在无数电梯的情况下, 上行和下行的概率才会相等。
那么, 一对夫妻四个子女最可能的性别比应该是什么? 母亲每次生孩子, 男孩和女孩的比例大致是 1 比 1, 这跟硬币的正反面相同, 所以四个子女最可能的比例应该是两男两女。 你觉得对吗?
我们不妨把所有的可能性, 包括顺序, 都列出来, 一共有 16 种 (见表 11.1)。
表 11.1 兄弟姐妹 4 人所有可能的性别分布
| 老大 | 老二 | 老三 | 老四 | 四女 | 三女一男 | 二男二女 | 三男一女 | 四男 |
| 女 | 女 | ✓ | ||||||
| 女 | 女女 | 女 | 女男 | ✓ | ||||
| 女 | 男 | ✓ | ||||||
| 女 | 女 | 女 | ✓ | |||||
| 男 | 女 | 女 | ✓ | |||||
| 女 | 男 | 男 | ✓ | |||||
| 女 | 男女 | 男 | 女男 | ✓ | ||||
| 男 | 女 | ✓ |
(续表)
| 老大 | 老二 | 老三 | 老四 | 四女 | 三女一男 | 二男二女 | 三男一女 | 四男 |
| 男 | 女 | 男 | 女 | ✓ | ||||
| 女 | 男 | 女 | 男 | ✓ | ||||
| 男 | 女 | ✓ | ||||||
| 女 | 男 | 男 | ✓ | |||||
| 男 | 男 | 男 | ✓ | |||||
| 男 | 女男男男 | 女 | 男 | ✓ | ||||
| 男 | 男 | 女男 | ✓ | |||||
| 男 | 男 | ✓ | ||||||
| 1 | 4 | 6 | 4 | 1 |
我们看到, 确实 的概率最高, 等于 。 看来你的猜测是对的。
但是且慢! 我们的问题是什么? 是性别比, 不是男比女或女比男的比例。 再回头看看表 11.1, 3 男比 1 女占了 4/16, 3 女比 1 男也占了 4/16, 加起来, 性别比为 3 比 1 的总概率就是 , 大于 2 比 2 的概率 。
这个例子告诉我们, 计算概率之前要想清楚每一个事件的准确定义是什么。 概率是个极为有用的工具, 但如果起点出了问题, 结果会谬误百出。 其实这个计算跟投硬币还是一样的, 只不过现在你需要同时投四枚硬币, 来考察每一次四枚硬币可能出现的情况是怎样的。 读者有兴趣, 可以找四枚硬币试试看, 正面与反面代表男或女, 看看是否会得到相同的结果。
最后讲讲为什么从概率角度来看不值得去赌场。
第八章的故事告诉我们, 从概率上讲, 在正常的 21 点游戏中, 庄家占有 8% 的优势。 根据伯努利大数原理, 赌21点的人越多, 庄家的这个优势就越确定, 所以对庄家来说, 赚钱是肯定的。 也许偶尔会有一位赌客赢一大笔钱, 但那只是偶然的机会, 绝大多数赌客都会输。 对于一个赌客来说, 哪怕赌得没日没夜昏天黑地, 你的赌局数量比起成千上万的赌客来说仍然微不足道, 所以你的赌局结果都是随机的。 没有人指望说, 我去年来赌时, 10 局当中赢了 8 局, 所以今年我肯定也会如此。 除非你会算牌, 就像麻省理工学院的那些年轻人。 这也就是为什么赌场禁止算牌:大家都算牌, 赌场的优势就不见了。 赌场要想尽办法抓出算牌者, 或者从一进门就让有这种能力和意愿的人望而却步。 于是赌场总要抓到算牌者并给他们难堪, 想出各种不违法的手段侮辱他们, 让这些人打消算牌的愿望。 其他赌场游戏也是如此, 庄家早就计算好了他们的优势, 只等赌客们自投罗网, 把辛辛苦苦挣来的钱投入庄家的钱袋。 既然输的概率远远高于赢, 又有那么多令人不快的结局, 为什么要去赌它呢?
彩票之类的也不例外。 根据本篇的知识, 读者可以独立分析赢彩票的概率。 以美国的强力球 (Powerball) 彩票作为例子。 每张强力球彩票售价 2 美元, 玩家购买之后, 从 69 个带有 1 到 69 数字的白球中选择 5 个号码, 称为普通号码; 然后再从 26 个带有 1 到 26 数字的红球中选择 1 个号码, 称为特别号码。 美国东部时间每周三和每周六晚 10:59 开奖, 由主持人通过摇奖机抽出中奖号码。 猜对所有 6 个号码者获得大奖, 奖额一般从 4000 万美元起价。 如果抽奖没有赢家, 大奖金额就累积到下一次抽奖, 最高时曾达到过 15.86 亿美元。 这么大的金额当然极有吸引力, 那么赢得强力球大奖的概率是多少呢?
我们已经知道, 从 69 个数字里选出 5 个来, 一共有 种可能的选法。 在强力球抽奖时, 所有这些选法都以相同的概率可能出现, 所以猜中 5 个号码的概率是 1 比 11, 238, 513。 在猜中这 5 个号码之后, 你还必须猜中那个特别号码。 从 26 个号码中选出任何一个的概率是 1 比 26。 综合起来, 获得大奖的概率就是 。 也就是说, 差不多是 3 亿分之一。 根据美国国家气象局的统计, 美国平均每年受到雷击受伤和死亡的人数是 270, 美国的人口大约是 3 亿 3000 万, 由此, 我们可以估计一个人在一年里可能遭到雷击的概率是 。 换句话说, 一个人在一年里遭到雷击的概率比中奖的概率要高将近 240 倍。 如果你猜中 5 个普通号码, 但没有猜到特别号码, 你可以得二等奖, 奖额大约 100 万美元。 赢得二等奖的概率 (1 比 11, 238, 513) 大约是遭雷击概率的十分之一。
前爱德华州乐透奖委员会主席琼斯 (Roger Jones, 1938-2013) 说过一句名言: “我觉着啊, 彩票就是从不懂数学的人身上收税。 ”(I guess I think of lotteries as a tax on the mathematically challenged.)
本章主要参考文献
Wheelan, C. Naked Statistics: Stripping the dread from the data. New York: W.W. Norton and Company, 2013: 282.
Royal Statistical Society. Royal Statistical Society concerned by issues in Sally Clark case. The Royal Statistical Society. http://www.therss.org/uk/archive/evidence/sclark.html (8/24/2004).