前言

从早到晚，我们每天都需要面对可能发生的事情做出成千上万有意识或无意识的选择。在漫长的人生道路上，需要做抉择的事情更是层出不穷。在考虑和抉择的过程中，一个极为重要的概念就是概率。

什么是概率? 这里先不谈定义什么的，看两个例子吧。一个立方形的骰子，它的六个面上分别有 1 到 6 这六个数字。把这个骰子投在桌面上，你觉得朝上的那一面会是奇数还是偶数? 一位少年看上一个女孩，很想与她共度一生。他们俩成为眷侣的可能性会有几成呢? 在第一个例子里，如果骰子的制作是完美无瑕的，那么任何一次投掷，各个面的出现具有相同的可能性，都是 $1/6$ 。这种 “可能性” 就是各个面出现的概率。因为六个面上， 3 个是偶数， 3 个是奇数，所以投掷一次出现偶数和奇数的概率相等，都是 $3/6 = 1/2$ 。在第二个例子里，多情而自信的男孩可能以为，有九成的把握能与女孩同作比翼鸟，共结连理枝；可实际上女孩正在暗恋校篮球队的队长，在她看来一成希望都没有；而在男孩的朋友看来，或许只有二三成。你要是问他们:这几成的估计是如何得来的? 恐怕没人能给你一个确定的答复。这种可能性也是概率，但与骰子的概率不同。投骰子的问题可以称为客观概率，它是对一个特定事件，用过去 (或者任何时间) 在多次同样的情况下，该事件发生的相对次数 (也就是频率) 来估计下一次事件发生的概率。追女孩的问题是主观概率，那个男孩可能根据一些微小的迹象来说明那女孩对他有好感，或者他根本没怎么接触那女孩，只是莫名其妙地喜欢她。面对同样的观察和场景，不同的人做出不同的判定，给出不同的主观概率。

介于这二者之间的是经验概率。这是指根据经验估计的事件成功或失败的概率。例如，在 $n$ 次试验中，事件 $A$ 出现 $m$ 次，那么比值 $m / n$ 是事件 $A$ 成功的相对频数。如果随着试验总次数的逐步增大， $A$ 成功的次数 $m$ 和试验次数 $n$ 之比 $(m / n)$ 趋于某个常数，这个常数就是经验概率。比如中国男足在历届亚运会上对阵韩国队的战绩到目前为止是四战皆负。在有限的数据面前，似乎国足战胜韩国希望渺茫。但是很多因素在发生变化，用以前的表现来预测未来，准确性十分有限。再比如， 2016 年美国总统大选之前几个月，美国各大民意调查机构根据采集的数据，估计希拉里获胜的概率在 80%-90% 甚至更高。可是 11 月 8 日投票开始，民调人员问询投过票的人们的选择，希拉里的获胜概率急剧下跌。另外，虽然按照个人选择，希拉里获得选票较多，但是在边远落后、人口稀少的州，支持特朗普的人却占了微弱的多数。最后，尽管从个人选票的总数来看，希拉里占了优势，但美国的选举人制度却把总统的头衔给了特朗普。在所有民意调查机构中，最有名的，是一个名叫 “538” 的网站。 2008 年， “538” 不仅准确地预测了奥巴马当选总统，而且正确地预测了美国 50 个州每个州的选举结果。这使得人们以为这个网站 2016 年的民意调查非常可靠。可也就是在 2016 年， 90% 以上的民调结果都和选举结果完全相反。面对一个具有许许多多变量的问题时，经验概率就需要小心对待。

概率问题在我们生活中无时不在，无处不在。从处理问题的方法来说，概率就是根据已知的条件对结果进行推测。正如著名的古罗马政治家西塞罗 (Marcus Tullius Cicero，公元前106一公元前43)所说:“概率是生活的真正指导 (Probability is the very guide of life)。 ”

作为一门数学的分支，概率在每个科学领域都至关重要，不论是物理、化学、生物还是计算机科学。概率在社会科学甚至文学艺术的研究中也发挥着越来越重要的作用。生活中，懂得一些概率知识以后，你会发现很多所谓的直觉和常识其实都是错误的，比如，电梯第一次开门往上走和往下走的概率并不一定是 50 对 50 ; 一个有 4 个子女的家庭里，兄弟姐妹当中性别比例也不一定是 2 比 2。

与概率紧密相关的是统计。如果说概率论是通过已知的全体事件的发生状况来估计下一个具体事件的可能结果 (例如投骰子)，那么统计学可以说是通过某些具体事件的结果来归纳出全体事件发生的规律。这种规律通常需要大量的观察才能得到，而得到的规律常常是无法用简单的数学公式来表达的。上面提到的男足和美国大选就是很好的例子。统计学需要概率论作为基础。

科学实验也是如此。实验者受到实验设备和时间的限制，数据不可能准确无误; 要想评估从这些有限的实验数据推论而得到的法则或假说的可信度，这就更需要归纳和统计。科学理论都是相对真理，它们在有限的实验观测的范围里被证明是正确的，但与之相应的概率估算不可能是完全准确的。随着新的观测技术和资料的出现，概率估算不断被质疑和修正，依赖于原先观测数据得到的理论或假说也必然会相应地被补充或修正。

这么说，听上去干巴巴的，很抽象。还是讲故事吧。这里面有许多有趣的人，他们的一生有悲剧，有喜剧，还有惊悚剧。至于他们的故事，有的让人荡气回肠，有的却令人扼腕叹息。

引子:种豆子的修士

布尔诺 (Brno) 是捷克共和国第二大城市，位于首都布拉格东南大约二百公里，属于摩拉维亚 (Moravia) 地区。布尔诺的中心是一座美丽的老城，虽然方圆只有一公里，却已经有近千年的历史了。这里红瓦黄墙的老房子密密麻麻，铜绿斑斑的教堂尖顶高高低低，争先恐后地从红屋顶丛中伸出头来，点缀着盛夏的天空。老城的西南侧有一座小山，一片葱绿。山顶上，斯皮尔伯格 (Spilberk) 城堡昂然耸立。这座城堡建成于 13 世纪，相当于中国的南宋末年。它起先是摩拉维亚藩侯的行宫，后来被布尔诺城市连同小山一道买下，改造成为城市的防御工事。这个明智的举动使得弹丸小城在欧洲中世纪为数众多的战争中固若金汤，从未被人攻破过。到了奥匈帝国时期，城堡逐渐变成监狱，关满了信奉新教的所谓“犯人”。再后来，这监狱又被用来关押意大利和波兰造反的人们，并因此而声名狼藉。数百年来，它一直默默地、严酷地俯视着山下老城里的芸芸众生 (图 0.1)。

图 0.1 从西北方向看斯皮尔伯格城堡 (小山上) 和现在的布尔诺城 (城堡的上方)。照片左下角白箭头下类似 $h$ 形的红屋顶就是圣托马斯修道院。 01952687-d372-7abb-afcb-1fdad5b56c54_2_289_968_1030_647_0.jpg

监狱城堡的西南，山脚下的平原上有一座古老的修道院。它建成于 1352 年，相当于中国的元朝末年。那一年，未来的明太祖朱元璋刚刚加入红巾军。修道院属于奥古斯丁教派(Augustinian)，后来的马丁·路德(Martin Luther， 1483-1546)是这个教派最有名的成员。这个教派的修士们过着和出家隐居的修道士们不大相同的生活。他们在城市附近建筑修道院，注重于向附近的居民传道，生活则依靠施舍和自耕自种。修道院的建筑呈h形，规模相当可观。 h的开口朝南，构成一个 50 米见方的花园，里面数百个花盆里盛开着康乃馨和吊钟花，也就是我们常说的吊挂金钟。康乃馨的花朵比拳头还大，五颜六色，争奇斗艳。吊钟花从粉色到深紫，荧光般耀人眼目，特别是那些双层花瓣的，有的外层花瓣浅粉，内层深紫，伸出长长的白色花蕊; 有的正好反过来，外层花瓣深紫，内层雪白，花蕊则是粉色的。

在修道院和监狱城堡之间的平地上，有一菜园，约有两三个足球场大小 (图 0.2)。一排排的豌豆架整齐利落，豌豆叶又厚又大，郁郁葱葱。布尔诺气候相当温和，冬季很少结冰，夏天气温难得超过 25 摄氏度，而且雨水适中，很适合园艺。

图 0.2 孟德尔工作过的园子。背景是修道院的建筑。 01952687-d372-7abb-afcb-1fdad5b56c54_3_302_882_1032_774_0.jpg

一个 30 岁左右的修士抓着口袋，沿着田垄有条不紊地收集成熟的豌豆。天气虽然不怎么热，但他的额头上却汗珠滚滚，黑色的修士服也浸透了汗水。该修士名叫格雷格 (Gregor)。这是德文的拼法，英文对应的名字是Gregory (格里高利)。这个名字来自拉丁文Gregiorius，而后者则源于希腊文“ $Γ$ ρηγóριoç”，本来是警觉、留意的意思。由于拉丁文的字头 greg 有羊群的含意，在天主教世界里，格里高利就被赋予了 “牧羊人” 的寓意，因而在宗教社会的人群里变得非常流行。这就是为什么历史上出现了十八个名叫格里高利的教皇。当然修士不能跟教皇相比。进入修道院之前，他在俗家时的名字叫约翰 (德文 Johann)。布尔诺在 19 世纪隶属于奥地利帝国，居民多数讲德语。那时捷克还没有建国呢。约翰这个名字，在布尔诺城里喊一声可能会有千百个男人回头。

这位名叫约翰的汉子确实太平凡不过了。他祖上三四代都是农民，拥有一个小农场。他出生于 1822 年，从小在农场长大，跟着父亲种菜养蜂。 18岁时进入离布尔诺不远的奥洛姆茨 (Olomouc) 的一所大学攻读哲学。家里经济窘迫，他经常付不起学费。为此，他的妹妹特雷西亚把自己的嫁妆份子拿出来供他读书。从小到大，他的身体一直不怎么好，休过两次学。手头拮据，身体羸弱，于是他在 23 岁时进入圣托马斯修道院，成为一名修士。这里衣食无忧，也使他得到了一个体面的法号格雷格。可是他似乎又不甘心终老于修道院，一边进行神父的修炼，一边在中学充当替补教员。 1850 年，他参加教员资格考试，结果在最后一轮口试中被淘汰。次年，修道院长纳普 (Cyrill Napp) 送他到维也纳大学去学习。在那里，教授他物理的是赫赫有名的多普勒教授(Christian Doppler， 1803-1853)。可是多普勒不久就去世了，纳普院长把约翰招回来，在修道院从事物理教学。 1856 年，约翰再次报考正式教员的职位，又在口试中失败。由此看来，他的运气很坏，口才似乎也有问题。

纳普院长一直有个长远的计划，想把圣托马斯修道院办成一个科学研究中心，所以约翰刚刚结束大学学业，就被他请到修道院来了。当时的布尔诺羊毛业十分发达，被称为 “摩拉维亚的曼彻斯特” (曼彻斯特是英国著名的工业城市)。在这样一个地方，繁殖高品质的种羊以增加羊毛产量，同时减缓种羊后代的退化是一个相当重要的话题。纳普在约翰加入修道院之前已经在当地的种羊繁殖协会活跃了二十年了，对动物和植物的驯化都有极大的兴趣。

人类从起初的单纯依靠狩猎采集为生转变到以农耕为主，经历了上万年的时间。在这漫长的时间里，人类逐渐积累了物种驯化的经验。狗是人类最早从狼驯化而来的家畜。狼逐渐驯化成家犬，经过许多代的演变，分出狼狗、牧羊犬、哈巴狗、吉娃娃等几百种外形、毛色、个性全然不同的类别来。可是尽管千差万别，却都能追踪到一个始祖，就是已经绝迹的远古灰狼。我们可以想象，最初人们只是把捉到的灰狼关到笼子里，用它们来威吓其他来捣乱的小动物。那些脾气暴躁倔强不屈的狼很快就死掉了，而性情随遇而安的可以长期存活。经过不知多少代有意无意的选择和淘汰，野性凶残的狼便逐渐 “变” 成了驯服忠诚憨厚可爱的狗。它们的原始野性被引导到其他方面，比如看家护院，照顾羊群，追逐猎物等等。可这只是一个假说，怎样检验它是否真的成立呢?

小麦是另一个例子。野麦的麦穗在成熟以后马上爆裂，麦粒撒落地上，以便再生出麦苗来。采集麦粒取食的人们选择那些麦粒壳破裂较慢的野麦，有意把它们栽种下去，希望能收获更多的麦粒。这样年复一年，最后麦粒到成熟期时就不再爆裂了，成了现在的农作物小麦。类似的例子举不胜举，千变万化。从野生稻到水稻，分出籼稻和梗稻两个亚种，每个亚种里又分出早中稻和晚稻两个群，每个群再分成水稻和旱稻两个型，每个型还分黏稻和糯稻两个亚种，等等。从颜色上看，稻米有白色的，也有红色的，甚至黑色的。

为什么有些物种驯化很成功，而有些却不成功呢? 为什么有些种羊的好的品质可以保留好几代，而有些到第二代就消失了呢? 纳普并不满足于种羊培育的实际问题，他觉得应该把驯化作为一个科学问题来研究。这是他把约翰招回修道院的主要原因。纳普花钱为约翰建造了温室，并准许他不参加修士修行的活动，还配备了几位园丁，帮助他进行植物的驯化研究。

从 1854 年到 1864 年，约翰在圣托马斯修道院进行了整整 10 年的研究。起初，他的主要目标似乎是改良植物品种。他引进了新西兰的菠菜，把它们养得巨大，叶子把地面都盖满了。他的康乃馨和吊钟花吸引来众多的布尔诺市民，全市的人都知道他侍弄植物的神技。 1861 年布尔诺城市的一家报纸《新闻》上，专门有报道盛赞约翰的园艺。

从 1856 年起，约翰种得最多的是豌豆。因为他的豌豆，修道院经常喝豌豆汤。但这并不是他的本意。豌豆越种越多，因为他发现豌豆有一些特征和形质在不同种类的豌豆之间杂交的过程中会有不同的组合。这种特征和形质，后来被称为性状 (Phenotypic trait，或者简单地称为 trait)。

许多植物需要受粉才能结出果实来。花粉是雄性配子，传到雌蕊的柱头，使雌性配子受精，才能结果。一株植物的花粉可以被昆虫、鸟类或者风传到另一株，这叫交互传粉。这样结出的果实可以兼有 “父母” 两方的性状。豌豆不仅交互传粉，还可以自身传粉，也就是一株豌豆上一朵花的花粉对同一株上的另一朵花授粉。自身传粉结出的果子当然只有本株所具有的性状了。这就使约翰可以有效地控制豌豆的性状。设想约翰先用两株不同的豌豆苗进行交互传粉，当得到具有他想要的性状的豌豆之后，再对这种豌豆苗进行自身传粉。那么，这种性状不就在这种豌豆苗的后代身上完全保留下来了吗?

约翰花了 8 年的时间，养殖杂交豌豆。他详细地记录了豌豆秧根部的长短和颜色，叶子的大小和形状，豌豆花的颜色、形状和位置，豆荚的颜色、形状和大小，豌豆粒的大小和形状，以及豆粒表皮和表皮下面胚乳的颜色。

逐渐地，他把注意力集中在那些仅仅有两种表现的单一性状上。比如豌豆花的颜色是一种性状。如果有两种豌豆，一种通过杂交之后只开紫色的花，另一种只开白色的花，那么把这两种豌豆再进行杂交之后，下一代豌豆开什么颜色的花?

为了进行这种实验，首先需要准备只开紫花和只开白花的豌豆。这必须是通过自花授粉的豌豆，因为只有这种方式才能保证花色的性状。由于豌豆每年只能种一季，这项工作至少需要一两年的时间。这是第零代豌豆。然后，他把紫花豌豆的雄蕊一个个剪掉，再用白花豌豆的花粉给紫花豌豆授粉。这些授粉的豌豆必须跟其他豌豆隔离，否则其他豌豆苗的花粉就会 “污染” 他的实验。这也需要一两年。这是第一代豌豆。他惊奇地发现，所有第一代豌豆都开紫花。这是偶然的吗? 他开始寻找其他只有两种表现的性状，比如豌豆粒的外观(接近圆形、表面光滑的和不定形、表面皱皱的)，豆荚的颜色(黄色和绿色)等等。他一共找到七对这样的性状。所有这些性状在第一代豌豆中都仅仅显示出一种性状来。他把这类性状称为显性性状，把与其对应的、没有表现出来的性状称为隐性性状。豌豆花的紫色是显性性状，白色是隐性性状。

下一步，他把第一代豌豆跟其他豌豆彻底隔离开来，只许它们自花授粉，生成第二代豌豆。他发现，在 929 株第二代豌豆中， 705 株开了紫花，其他 224 株开了白花。约翰对七种性状都做了详细的研究，结果如表 0.1 所示。这个表格的最后一列给出不同性状的比值，你能看出什么规律来吗?

约翰通过杂交培育了至少一万株豌豆苗，并且仔细观察记录了四五万朵豌豆花和几十万粒豌豆粒。他得到了一套庞大的关于豌豆性状遗传的数据。可是，怎么解释这些数据呢? 特别是，从表 0.1 能得出什么样的科学结论呢?

表 0.1 孟德尔进行豌豆杂交实验的记录数据

豌豆性状	显性性状	隐性性状	第二代的数目	数值比
豆粒形状	近于圆形	褶皱不规则	5 474 : 1 850	2.96 : 1
豆粒颜色	黄色	绿色	6 002 : 2 001	2.99 : 1
豆花的颜色	紫色	白色	705 : 224	3.15 : 1
豆花的位置	沿枝生长	在枝蔓顶端	651 : 207	3.14 : 1
整棵的高度	高	低	787 : 277	2.84 : 1
豆荚的形状	饱满平滑	高高低低	882 : 299	2.95 : 1
豆荚的颜色	绿色	黄色	428 : 152	2.82 : 1

两类数学方法在约翰处理数据中起到了决定性的作用。一类是排列组合 (准确地讲，叫组合数学)，另一类是概率统计。约翰首先选择一种性状进行分析，比如花的颜色。他把显性(紫色)和隐性(白色)性状分别用字母 A 和 a 来表示。通过前面的描述我们知道，约翰的第一代豌豆同时带有 $A$ (紫色)和 $a$ (白色)。第二代豌豆是从第一代自花授粉得到的，也就是说，两株同时带有 $A$ 和 $a$ 的第一代豌豆把自己身上的性状同等地传到它们的第二代身上。

如果每一种性状都是以等价的机会在第二代豌豆中出现，那么有多少种可能性呢？我们不妨做一张简单的表格来看看。在表 0.2 里，最左面一列是第一株第一代豌豆所携带的性状，最上面一行是另一株第一代豌豆的性状。它们之间，每两种性状搭配，一共能构成几种组合呢?

表 0.2 杂交豌豆携带性状的不同组合

	$A_{2}$	$a_{2}$
$A_{1}$	$A_{1} A_{2}$	$A_{1} a_{2}$
$a_{1}$	$a_{1} A_{2}$	$a_{1} a_{2}$

在这四种组合里面，具有 $A_{1} A_{2}$ 性状的豌豆显然都开紫花。具有 $A_{1} a_{2}$ 和 $a_{1} A_{2}$ 性状的也都开紫花，因为 $a_{1}$ 和 $a_{2}$ 是隐性性状，只有显性性状 $A_{1} 、 A_{2}$ 表现出来。最后，只有具有 $a_{1} a_{2}$ 性状的那些豌豆开白花，因为它们不具有显性性状。换句话说，在四种可能性里面，只有一种是开白花的。

如果所有第一代的豌豆都把自己身上的性状同等地传给下一代，那么在第二代出现这四种情况的机会就是同等的。于是根据概率的理论，约翰得出结论说，开紫花和开白花的第二代豌豆的数目出现的机会应该是 $3 : 1$ 。

类似的分析可以用在表 0.1 列出的所有七种性状上面。而且我们发现，约翰七种性状的实验，最后的比值真的都接近于 $3 : 1$ 。

从这个比值，约翰得到了一个非常重要的结论: 物种的性状是通过遗传从父母传给下一代的。这个结论震动了整个生物界，开创了遗传学这个崭新的领域。约翰也就以格雷格·孟德尔(Gregor Mendel， 1822-1884)的名字而彪炳青史。可惜，孟德尔自己并没有看到那一天。 1865 年，孟德尔在布尔诺自然博物学会上做了两次报告，介绍自己的工作。在场的有 40 多位听众，没有一个人能听得懂。第二年，他根据报告整理的德文文章《论植物的杂交》发表在一本不起眼的杂志上，也没有引起人们的重视。他多次跟著名的瑞士植物学家奈格里(Carl Wilhelm von Nägeli， 1817-1891)通讯，报告实验的结果，并阐述自己的理论。但奈格里不仅不相信他的理论，甚至还劝告他不要再继续这种“毫无意义的”实验了。

“我的时间会到来的”，孟德尔说。

1884 年，格雷格·孟德尔因心脏和肾脏疾病去世，享年 62 岁。

孟德尔的故事到此还远远没有结束。从 1900 年起，直到 1960 年代，一个传言在生物学界蔓延: 孟德尔的豌豆数据是捏造的! 于是孟德尔的名字刚刚得到人们的认识，便罩上了阴影。这些故事，我们要等到本书的后面再继续。

图 0.3 孟德尔 (M) 和其他修道院修士的合影 (照片大约摄于 1862 年)。带 N 标记的是纳普 (Cyrill Napp)。 L是约翰的助手林登塔尔 (Joseph Lindenthal)。孟德尔手里拿了一束吊钟花，应该是他杂交实验的新品种。 01952687-d372-7abb-afcb-1fdad5b56c54_9_303_240_1028_793_0.jpg

我们注意到，表 0.1 中的那些比值没有一个是准确的 $3 : 1$ ，有的大于、有的小于这个比值。这种观测和理论的差别，是理论的错误，还是实验的缺陷造成的? 孟德尔的实验是不是数目太少了? 如果从上万株扩展到几百万株，结果会不会很不一样? 这些问题，单靠实验是无法回答的。无限地扩展和重复实验也是不现实的。

孟德尔以及后来的生物学家们都面临这些问题。不仅仅是生物学家，任何一个实验科学家，无论是物理、化学、生物、天文还是材料，在分析处理观测数据的时候都不可避免地要面对类似的问题。如何从有限的、不完美的数据中得到相对可靠的信息? 还有另外一类问题，数据庞大芜杂，信号被噪声掩盖了，如何从这样复杂的数据中提取有用的信息? 人们在反复观察研究和不断相互争论的同时，逐步发展了概率统计学的方法。而概率统计理论的发展，又使科学、人类学、社会学、心理学、经济学等学科有了飞速的进展。今天，概率统计已经成为一种思维方式，变成我们生活的重要部分了。我们用GDP来估计国家经济发展的规模和速度，用出生率和死亡率来考察社会的年龄结构，用存活率来评价对疾病疗法的效果，等等。

不过，你也许不相信，概率统计的起源很早，而且受益于对游戏和赌博的认识。

Youliang Zhong

Graph View

前言

引子:种豆子的修士