第三十三章 孟德尔的数据是伪造的吗?

物理学家兼数学家戴森(Freeman Dyson, 1923-2020)说过这样的话:“有些数学家是鸟, 另一些是青蛙。 鸟高高翱翔在天空, 俯瞰延伸至遥远地平线的广袤的数学远景。 他们喜欢那些统一思想、并将不同领域的诸多问题整合起来的概念。 青蛙则生活在天空下的泥地里, 只看到周围生长的花儿。 他们乐于探索特定问题的细节, 一次只解决一个问题。 ”

其实, 任何一个科学领域都有这两类人。 在我们的故事里, 达尔文是鸟。 他花了 5年的时间周游世界, 广泛观察, 横观世界, 纵思历史, 写出了《物种起源》。 他指出, 所有的动植物都是由早期的、比较原始的形式演变而来。 这种演变是由 “天择”, 也就是自然选择所致 (所谓适者生存), 而且演化是长期连续性的缓慢改变 (也就是 “渐变”), 不是间断性的变化。 达尔文的理论是革命性的, 它震撼了整个西方科学界、伦理界和宗教界。 但这个理论并不完善, 它过分强调环境对演化的影响, 而没有给出一个物种本身遗传的因素。 达尔文简单地假定每一种生物体内有某种粒子, 从父辈传到子辈。 父母双方的粒子在子女体内按照不同的比例混合, 使子辈继承父辈的特征。 人们很快就发现, 这个所谓的 “泛生论” (Pangenesis) 有一个无法克服的困境: 如果遗传粒子的总数是守恒的, 那么子孙后代身上的粒子数应该按照几何比例一代一代减少, 以至消失。 如果是不守恒的, 那它们又是如何再生的呢? 个体之间的差异和观察到的物种的变异又是如何产生的呢? 这在当时是科学界最为瞩目的难题之一。 高尔顿在研究人类能力的遗传过程中看到这些问题, 认为可以用间断性的变化来解释遗传和物种变异。 但英国科学界对达尔文推崇备至, 任何不利于达尔文的理论都受到忽视, 连托马斯·亨利·赫胥黎(Thomas Henry Huxley, 1825-1895)对渐变论的质疑也不例外。

孟德尔是典型的青蛙。 他花了 8 年的时间在不满 500 平方米的菜园子里种豌豆。 他和达尔文是同时代人, 但两个人从未会面。 他的实验也遭到忽视, 长达 30 年。 在今天看来, 他的理论同达尔文简直是天作之合, 假如当时同时被人们接受, 生物学的进展可能要早一个世纪。 当然, 历史是没有假如的, 于是就有了下面的故事。

1878 年, 英国的剑桥大学有三个年龄相仿、个性极强的本科生。 国王学院 (King’s College) 的皮尔逊年龄稍长, 还有一年就要毕业了;圣约翰学院 (St. John’s College) 的维尔登 (Walter Frank Raphael Weldon, 1860-1906) 和贝特森 (William Bateson, 1861- 1926) 都刚入学不久。 这三个人都是高尔顿的忠实追随者, 后来对概率统计和群体遗传学的发展都做出了重要贡献; 又由于科学观念不同而反目成仇, 大吵大闹, 一直持续到生命的尽头。 科学史学家说, 假如 (又是一个假如) 他们三人能互相包容, 同心协力, 关于遗传基因的理论很可能提前半个世纪就出现了。

我们已经在前一章里介绍了皮尔逊在概率方面的工作。 他本科学的是数学, 成绩优异, 但毕业后却跑到德国去攻读哲学、法律和德国古典文学, 并发表了相当多的作品, 其中关于康德 (德文: Immanuel Kant, 1724-1804) 星云说的著作是爱因斯坦年轻时认为必读的作品之一。 27 岁时, 皮尔逊成为伦敦大学学院应用数学与力学系主任, 1891 年又成为著名的格雷善姆学院 (Gresham College) 的几何学教授。 这个学院没有学生, 教授只做研究。 皮尔逊本来没有任何研究遗传学的背景, 但当他读到高尔顿的 《自然的遗传》(Natural Inheritance) 以后, 一下子变得对这个领域极感兴趣。 在格雷善姆学院, 皮尔逊结识了动物学专家维尔登 (图 33.1), 后者急切地想要了解如何在遗传学研究中使用精确的数学手段, 两个人一拍即合。 通过维尔登, 皮尔逊这才对高尔顿的遗传理论有所了解, 之后便成为高尔顿坚定的崇拜者和追随者。 皮尔逊从此对用统计学处理生物遗传问题的方法坚信不疑, 穷尽余生之力用概率统计学方法研究遗传。 他们定量分析了许多物种的变化, 认为连续变化是演化论的唯一动力。

01952687-d372-7abb-afcb-1fdad5b56c54_342_824_1010_486_633_0.jpg

图33.1 拉菲尔·维尔登。

维尔登本科修的是动物学, 毕业后, 跑到意大利南部研究海洋生物。 1882 年, 年仅 22 岁的维尔登回到剑桥大学做讲师, 教授无脊椎生物形态学。 1889 年, 他成为伦敦大学学院动物学系主任。 同年, 高尔顿的《自然的遗传》出版。 书中, 高尔顿用简单的概率分析手段处理复杂的生物遗传问题。 他做了诸多的假定, 计算处理的方法有时还互相矛盾, 引起后人众多的非议。 不过在当时, 这本书的影响非常大。 它显示, 可以用概率统计的方法对遗传学问题进行定量分析, 同时明确反对达尔文演化的理论, 认为物种的变化是跃变而非渐变。 维尔登读了以后兴奋异常, 觉得高尔顿的概率统计方法可以处理很多动物形态学方面的现象。 次年, 他转入牛津大学任教。 维尔登的数学底子不怎么样, 但在皮尔逊的影响下, 他在数学方面做了很大的努力, 曾经把一套 12 个骰子连投了 26306 次, 期望从这些枯燥的数据中得到一些概率统计方面的知识。 他的数据后来被许多概率统计研究者所分析, 这些数据是皮尔逊提出卡方概念的根据之一。 这些研究的努力使维尔登成为利用概率统计学研究遗传学的坚定支持者, 他断言说: “达尔文假说所提出的问题都是纯粹的统计学问题; 目前统计学是唯一可以用来通过实验检验这个假说的方法。 ”

贝特森(图 33.2)入学比维尔登晚一年, 但成绩也是名列前茅, 他个性孤僻, 很少有朋友, 但是在维尔登毕业之前, 两个人极为要好。 维尔登生物研究的背景也多一些, 对贝特森帮助很大, 被贝特森视为自己的老师。 贝特森最初的兴趣在胚胎学。 在维尔登的建议下, 他毕业后到了美国, 在霍普金斯大学(Johns Hopkins University)生物系教授布鲁克斯(William Keith Brooks, 1848- 1908)的指导下研究一种叫做柱头虫的海洋生物。 这种状似蚯蚓的生物介于脊椎生物和无脊椎生物之间, 使贝特森对脊椎生物的演化过程产生了极大的兴趣。 个性孤僻的贝特森同布鲁克斯建立了非同一般的师生情谊。 两年的时间里, 二人做过无数次深入的探讨, 常常是身患先天性心脏病的老师和衣躺在床上, 贝特森坐在床边, 一谈就是几个小时。 布鲁克斯认为, 物种演化有连续变化也有不连续的变化, 而达尔文却过高地估计了渐变的作用, 这种想法影响了贝特森的一生。 在美国的工作结束后, 贝特森又到了俄国, 研究环境对物种变化的影响。 1887 年他回到圣约翰学院, 研究物种变化和遗传。 读到《自然的遗传》以后, 贝特森也变成了高尔顿的忠实追随者。 但他注重的是物种的不连续变化, 而皮尔逊和维尔登强调的是概率统计分析的方法。 1894 年, 贝特森发表了《物种变异研究资料, 侧重于物种起源不连续性的处理》(Materials for the Study of Variation, Treated with Especial Regard to Discontinuity in the Origin of Species), 其中列举了 886 个例子, 说明物种的变化是不连续的。 在这本书里, 他首次使用遗传学这个词来描述遗传和变异的规律。 高尔顿和赫胥黎也对达尔文的渐变论有疑问, 因此对贝特森的巨著评价极高。 但是维尔登写的书评却相当负面, 甚至暗示书中所有的结果都是错的。 这大大地激怒了敏感的贝特森, 两个人从此争论不休, 直到维尔登突然去世为止。

01952687-d372-7abb-afcb-1fdad5b56c54_343_333_989_401_632_0.jpg

图33.2 威廉・贝特森。

这三位都是个性极强的人, 皮尔逊性格强势, 得理不饶人, 难以接受不同意见;维尔登自幼孤独, 体质羸弱, 但一旦工作起来死活不顾;贝特森不仅孤僻而且极为敏感, 经常以为自己遭到攻击, 而且必定全力反击。 三个人都是皇家学会生物进化委员会成员, 委员会会议常常变成三人争吵辩论的战场。 为了几个科学问题, 他们在《自然》期刊上发文互相攻击, 以至《自然》编辑部几次拒绝刊登他们的争论文章。 也正是由于贝特森支持突变论, 使维尔登和皮尔逊感到皇家学会期刊已经不是他们说话的地方, 于是说服高尔顿, 三个人创立了一本新的科学期刊《生物计量学》(Biometrika), 重点就放在利用概率和统计研究生物计量学(Biometrics)。 皮尔逊坚持用Biometrika而不用Biometrica, 因为他的名字 (Karl) 的头一个字母是 k。

1889年, 荷兰植物学家德佛里斯 (Hugo Marie De Vries, 1848-1935) 著书修正达尔文的泛生论。 他提出一个假说: 生物依靠体内无数个各不相同的粒子把特性从一代传给下一代。 他把这种粒子叫做 pangenes。 20 年后, 这个名字被砍掉一半, 变成了genes, 也就是我们今天经常使用的 “基因”。 至于物种的变化, 德佛里斯是 “突变” (mutation) 这个生物界特指名词的创造者。 为了检验泛生论的假说, 德佛里斯进行了一系列的植物杂交实验, 发现了跟孟德尔类似的结果。 德佛里斯采用显性、隐性、分离以及独立分配定律 (Laws of dominance, recessive, separation, and independent distribution) 来解释他的结果, 想法同孟德尔不谋而合。 在撰写论文的时候, 他发现孟德尔早已报告了关于豌豆的实验结果。 不久, 德国的柯伦斯 (Carl Correns, 1864- 1933) 和奥地利的契马克(Erich von Tschermak, 1871-1962)也在各自独立的研究中发现了这些定律。 1900 年, 德佛里斯在发表自己的研究结果时采用了孟德尔的用语, 但却只字不提孟德尔的工作。 直到柯伦斯指出这一点, 德佛里斯才承认有孟德尔的工作在先。

顺便说一句, “基因” 这个中国词的翻译者是著名遗传学家谈家桢 (1909-2008)。 “基”本的 “因” 子, 发音又非常接近英文的gene。 这是把外文概念引入中文词汇的典范。

1900 年 5 月 8 日, 在前往皇家园艺学会参加会议的路上, 贝特森第一次读到孟德尔的文章, 惊喜万分。 孟德尔的结论证实了他自己正在构思的理论, 于是他马上动手修改准备讲授的论文, 把孟德尔的理论加入其中。 在英国, 达尔文的影响是巨大的。 达尔文关于物种演变的渐变论一直是生物界的主流, 不少人认为孟德尔的理论违反了达尔文理论, 但是贝特森决意要改变现状。

以皮尔逊和维尔登为首的 “生物计量派” 人士坚信渐变论, 不屑以贝特森为首的 “孟德尔派” 的理论甚至怀疑他们的观察和实验数据。 双方开始了持续数年的论战, 在英国演化论年会上, 两派经常争论得硝烟四起, 口沫与汗水齐飞。 贝特森的概率统计底子比维尔登还要差, 但是经过仔细的研读, 他吃透了孟德尔理论的精髓, 而且具有杰出的实验研究技能, 他不需要用概率参数来说服骑在墙头的同行们。 维尔登的学生达比夏 (Arthur D. Darbishire, 1879-1915) 在老师的指导下对老鼠进行杂交实验, 连续四五年的时间里, 不断发表数据支持渐变论, 反对孟德尔的遗传理论。 但是贝特森在与达比夏私下交流中发现, 这些实验存在不少的问题, 比如第一代老鼠不是纯种, 因而对下一代的性状无法精准地控制; 另外报告只提到数据的一部分, 还有一些对报告结论不利的数据, 作者却根本不提。 在贝特森的指导下, 达比夏逐渐意识到, 这些不利数据其实正是孟德尔理论所预测的。

1902 年 1 月起, 维尔登在 《生物计量学》上陆续发表数篇文章, 对孟德尔发难。 他首先指出, 孟德尔的数据从概率论的角度看上去, 过于完美。 维尔登本来可以用皮尔逊的卡方分析来对孟德尔的数据进行深入研究, 但他没有这么做。 他只是指出, 豌豆的许多特征并不像孟德尔文章里的数据那样清晰无误。 绿色的豌豆有时带一点黄, 豌豆皮也不是要么光滑如婴儿, 要么褶皱如老翁。 总之, 判定豌豆的特征带有不可避免的主观因素。

然后维尔登对孟德尔的理论进行了批判。 维尔登在与人辩论时似乎有忍不住要歪曲别人论点的倾向。 他的批判实际上说明他没有读懂孟德尔的理论, 贝特森抓住这一点, 毫不留情地反击。 贝特森把孟德尔的文章翻译成英文, 并按照自己的思路详细解释孟德尔的遗传理论, 指出维尔登在援引孟德尔时的谬误之处。 最后, 他干脆对整个生物计量派发起了攻击:

我们近来被不止一次地告知, 生物学必须成为精确的科学。 这也是我的热望。 但是, 数值的精准并不总能达到科学的确切。 有许多大自然的学生, 他们不大熟悉概率统计的妙招, 但是追求真理的直觉使他们免于不正当的推论、乱七八糟的论证、对权威的反复和荒诞的误用。

确实, 概率统计可以帮助研究人员评估一个模型成功或失败的程度, 也可以帮助寻找某些在观测之前想象不到的因素对观测结果的影响。 但是如果没有创新的思想, 只是利用各种指标算来算去, 很难做出新的发现。 我们在第三十二章那些公式里就能感觉到皮尔逊转来转去寻找不同指标来描述同一类问题的倾向。 概率论遇到遗传学, 急需新的思想和研究方法, 但皮尔逊等人只是在老旧的理论里转圈子。

这场长达十几年的 “战争” 给维尔登带来了极大的精神压力。 1906 年, 他在与妻子度假当中仍然不停地工作, 结果染上风寒, 转成肺病, 不得不放弃假期。 回到伦敦后, 他仍然坚持工作, 很快一病不起, 终年46岁。 维尔登的老师和学生也都很不幸。 他的大学老师巴尔佛尔 (Francis Maitland Balfour, 1851-1882) 死于登山事故, 年仅31 岁。 他的学生达比夏在第一次世界大战期间参军, 于军训中罹患脑膜炎, 36岁去世。

贝特森的孟德尔派在英国逐渐站稳了脚跟, 人们开始怀疑达尔文物种演化的细节。 1908 年, 剑桥大学得到匿名捐助, 要求设立一个遗传生物学教授的职位, 剑桥大学把这个职位给了贝特森。

1909 年是达尔文诞生 100 周年、《物种起源》发表 50 周年, 剑桥大学举行了盛大的纪念活动。 剑桥的国王街上, 一端正在把达尔文许多尚未发表的手稿装订成册, 另一端走来刚刚入学的罗纳德·费舍尔(Ronald Aylmer Fisher, 1890-1962)。 这个19 岁的年轻人正在辗转犹豫, 到底是学生物还是学数学。 他天性聪明, 早期在中学就在老师的影响下对生物充满了极大的兴趣。 他又天生眼疾, 读起数学公式来有困难, 总是想办法将复杂的公式转变成几何问题闭上眼睛进行分析。 直到有一天, 他在自然博物馆里看到了一个鳕鱼头骨的展品。 头骨被仔细地拆分开来, 摆满了整个展示柜。 近百片骨头, 每一片都有特殊的拉丁文名字。 费舍尔不想把时间花在枯燥的死记硬背上面, 于是决定主攻数学。 三年后, 费舍尔以第一名的成绩从数学系毕业。 而从入学开始, 他就带着全套的达尔文全集, 书架上摆着长长的一排, 总共 13 卷。 整个大学期间, 在本科课程之外, 他反复阅读达尔文的《物种起源》和贝特森的《孟德尔遗传学原理》。

毕业后, 他得到了奖学金, 又花了一年的时间到著名的卡文迪许物理实验室 (Cavendish Laboratory) 学习统计力学、量子理论和误差分析。 严谨扎实的数学、生物学、物理学背景为他的未来铺就了一条康庄大道。 不过由于过度用功, 他的视力变得更加糟糕, 于是跑到加拿大一座农场去休养。 返回英国不久, 第一次世界大战爆发。 他因眼疾不能参军入伍, 只好留在伦敦从事统计员工作, 同时在伦敦的公立中学里讲授数学和物理课程。 业余时间, 他就用来研究达尔文的《物种起源》和孟德尔的遗传理论。

1918 年, 他发表了《孟德尔遗传假定下的亲属之间的相关性》(The Correlation Between Relatives on the Supposition of Mendelian Inheritance)(以下简称《相关性》), 第一次引入统计学的变异值 (variance) 分析方法。 所谓变异值就是方差, 我们在第三十和三十二章里已经提到了, 方差等于标准偏差的平方。 这个概念在费舍尔以前就有了, 不过 variance 这个词是费舍尔发明的。 更重要的是, 费舍尔证明, 随机而且相互无关的变量的方差可以简单相加。 利用这个原理, 他分别考查显性基因、异位显性基因之间的相互作用, 以及选型交配、多重等位基因, 和亲属之间相关性的链接等各种因素的影响, 然后根据方差的特性把这些因素叠加起来, 考虑总体的遗传效果。 他把孟德尔著名的分离定律 (Law of segregation) 应用到一个生物群 (比如人类), 证明孟德尔的显性因子和隐性因子的相互作用会使亲属之间的相似性变得模糊而连续。 这样, 费舍尔就从概率理论上证明, 生物计量学观察到的事实不但同孟德尔的理论没有矛盾, 而且正是多个单独的孟德尔效应协同作用的结果。 同时, 这个理论也说明, 等位基因频率会随着自然选择而演化, 从而解释了达尔文的自然选择机制。

一个不为人知的年轻人, 就这样用一篇文章, 把皮尔逊、维尔登、贝特森十几年的战火硝烟消弭得一干二净。

《相关性》实际上在1916年就已经写好了, 先投到《伦敦自然科学会报》 (Philosophical Transactions of Royal Society of London), 但是被拒稿。 两个评审人皮尔逊和庞奈特(R. C. Punnett, 1875-1967)都承认没有读懂。 这并不说明这两个人能力不够, 而是费舍尔的文章都相当晦涩难懂, 这一篇尤其如此。 但是两位评审人在给编辑部发表推荐意见时, 却又说这篇文章没有重要价值。 不仅如此, 皮尔逊还给费舍尔写信, 以长辈的姿态教训了 26 岁的年轻人, 这让高傲的费舍尔非常恼火。 早在 1914 年读本科的时候, 费舍尔就给《生物计量学》投过稿子, 批评皮尔逊在使用卡方进行统计分析过程中存在的问题。 费舍尔觉得皮尔逊是记仇故意刁难自己。 1918 年, 达尔文的第四子伦纳德(Leonard Darwin, 1850-1943)帮助费舍尔把《相关性》发表在《爱丁堡自然科学会报》(Transactions of the Royal Society of Edinburgh)上。 这是一篇里程碑式的文章, 它将达尔文与孟德尔的学说圆满地结合起来, 开创了计量遗传学 (Biometric genetics) 的先河。 不仅如此, 费舍尔在处理遗传问题时对于变异值 (也就是方差) 的分析又开创了概率统计学定量分析的新时代。 当时费舍尔只有 28 岁。 而按照他女儿后来的说法, 早在 1911 年, 也就是他本科三年级的时候, 《相关性》中的思想就已经成熟了。

费舍尔的《相关性》虽然不好懂, 但引起了广泛的注意。 1919 年, 有两个地方同时想招聘他。 一个是皮尔逊担任所长的伦敦大学学院高尔顿实验室, 另一个是英国最老的农业研究机构罗森斯特实验站 (Rothamsted Experimental Station)。 费舍尔不喜欢皮尔逊, 在加拿大的经历又使他对经营农场的兴趣大增, 他放弃了当时声名卓著的高尔顿实验室, 跑到罗森斯特做了个临时统计分析员。 这个实验站从 1842 年开始在农田里进行实验, 积累了海量的数据。 费舍尔使用自己的变异值分析方法分析了这些数据, 发表了《农作物变异分析》(Studies in crop variation)。 皮尔逊实验室的厄文 (Joseph Oscar Irwin, 1898-1982) 为了了解费舍尔的方法, 专门转到罗森斯特在费舍尔手下做事。 后来, 厄文写了不少介绍费舍尔工作的文章。 许多后来的统计学家是依靠厄文的介绍才理解费舍尔的。

费舍尔在罗森斯特工作了 14 年。 在分析化肥与有机肥对农作物影响的数据的同时, 他仍然继续研究概率统计和遗传学。 他在家里养了大量的动物, 如猫、狗, 以及数千只杂交的老鼠。 他对每一种动物几代的特性都有仔细的记录。 1925 年, 他发表专著《研究人员的统计学方法》(Statistical Methods for Research Workers)。 这是20世纪最有影响力的统计学方法专著, 到 1970 年已经出到第 14 版。 1930 年, 费舍尔发表了《自然选择的普遍理论》(The General Theory of Natural Selection)。 这本书成为现代演化理论的核心, 它帮助定义了群体遗传学, 并重新激活了达尔文的性选择理论。 这本书被许多教科书引用, 因为它解释了很多生物演化中奇奇怪怪的现象。 他说: “自然选择是一个能够产生极高的不可能性的机制。 ”

费舍尔的名声越来越大。 1933 年, 他受聘到伦敦大学学院优生系当系主任, 继续在遗传学和概率统计学两个领域推陈出新。 1935 年, 他发表 《实验设计》(The Design of Experiments), 介绍了概率统计在实验设计上的重要作用。 1937 年, 他又提出群体动力学的费舍尔方程。 在教书与研究的空隙, 他决定把孟德尔报告中的数据用概率统计学方法从头到尾分析一遍。 他想把孟德尔的天才整个展现给生物界, 因为真正下功夫读孟德尔德文原著的人太少, 多数研究人员都在人云亦云。

可是, 谁也没想到, 费舍尔在把孟德尔拉到与达尔文比肩齐背的地位之后 20 年, 似乎在不经意之间又把他拉下来了。

在重新分析了孟德尔的数据以后, 费舍尔意外地发现: 整个数据过于完美了。 比如, 孟德尔关于豌豆颜色和外皮光滑程度的数据给出 “黄色/光滑” 对 “黄色/褶皱” 对“绿色/光滑”对“绿色/褶皱”豌豆的数量比是9.05比2.93比3.11比0.91。 孟德尔的理论比值是 9 比 3 比 3 比 1。 对于这个有 个观测量的问题, 自由度 , 费舍尔得到的卡方值为 0.47。 查皮尔逊给出的卡方与 -值对照表, 得到一个很大的 -值 0.925。 如果把孟德尔所有的数据都考虑进来, 一共有 84 个自由度, 对应的 -值 。 这是什么意思呢? 让我们再看一下图32.5。 按照费舍尔的分析, 99.997%的正态分布曲线都落在孟德尔数据的外边。 也就是说, 图 32.5 右边的绿色区域占据了整个正态分布曲线下面49.9985%的面积。 与这个区域相对称, 正态分布的左边应该也有相同的 49.9985% 的区域落在所对应的 -值范围里。 换句话说, 做 10 万个实验, 只有 3 个可能比孟德尔的结果更接近他的理论, 也即零假定成立。 于是费舍尔得出一个惊人的结论:孟德尔的数据有造假的嫌疑!

孟德尔“作弊”, 如同参加竞选的政治人物被人甩上泥污, 沾上后说不清道不白。 费舍尔在文章里比较客气, 说可能是实验助手为了迎合孟德尔的意图而修改了数据, 但私下里, 他对同事说, 孟德尔的做法 “可恶”、“令人震惊”。

费舍尔的文章发表 30 年后, 生物界和统计学界对这个问题的讨论变得越来越激烈, 发表文章的数目逐年增加。 有人认为, 孟德尔必须对自己的数据负责。 另一些人认为, 对豌豆的形态的判别带有某种主观因素。 比如, 维尔登早就指出过, 观测豌豆的颜色、褶皱程度等有时需要观测者凭主观来判断。 其实孟德尔在文章里明确指出, 有些豌豆实验结果被排除在外。 还有人说, 在统计数据之前, 孟德尔或他的助手可能下意识地对实验的豌豆做了筛选。 毕竟这是在一百五六十年以前, 生物科学中的实验规程还没有完全建立起来, 概率统计学分析的手段也非常落后。 用现代的标准来要求 150 年前的孟德尔是不大公平的。 也有人认为, 费舍尔在对数据采集过程完全无知的情况下, 对孟德尔报告的数据进行理想的概率分析, 必须依靠许多假定, 而这些假定大多数是没有根据的。

有人近乎开玩笑地评论说, 对于遗传学和统计学界的某些人士来说, 孟德尔 - 费舍尔的争议犹如疯狂影迷观看著名电影《卡萨布兰卡》(Casablanca): 看完一场马上期待下一场。 但越来越多的人注意到, 费舍尔在分析中也犯了一个错误——他把两组不同的数据放到一起去分析。 如果把第二组数据除去, 含数据量最大的第一组数据跟费舍尔期望的概率之间没有很大的区别。 而他的 “小错误” 就是甩泥巴的棍子, 让孟德尔灰头土脸七八十年。

从外表来看, 费舍尔比普通人还要普通 (图 33.3)。 他总是眯缝着眼睛, 即便戴着比汽水瓶底还要厚的眼镜, 仍然看不清一两米以外的东西。 他不修边幅, 身上的衣服总是皱皱巴巴的, 好像从来没洗过。 他一时一刻也离不开烟, 即便在游泳池里也叼着烟斗。 他又是一个性格怪癖、不易相处的人。 在跟别人交谈的时候, 如果他对谈话内容不感兴趣, 会从嘴里抠出假牙来, 在众目睽睽之下坦然地擦拭。 他在伦敦做教授时, 把老婆孩子丢在乡下农场, 只给他们一点点可怜的零花钱。 他把别人的批评全都解释为个人攻击, 经常在同一个时间跟好几位科学家争辩, 有时言辞之刻薄令人久久无法原谅。 而在骨子里, 他也并没有因此而从中得到释放; 恰好相反, 他自己也受到敌意的侵蚀。 不过在概率统计领域内, 他在多数情况下是对的。

01952687-d372-7abb-afcb-1fdad5b56c54_350_276_1239_606_462_0.jpg

图33.3 罗纳德・费舍尔。

跟高尔顿、皮尔逊一样, 费舍尔也是坚定的种族主义者。 1950 年, 联合国教科文组织邀请世界上著名的人类学家在巴黎就种族问题起草《关于种族的宣言》 (Statement on Race)。 宣言指出 “种族” 或 “人种” 在概念上的混乱以及滥用的危险性, 主张用 “族群” (Ethnic group) 来取代。 这些人类学家认为, 构成族群差异的主要是文化。 从生物学的角度来看, 对于 “人种” 最基本的认知大概可以总结为 “根据体质形态和遗传特征显著的指标, 将人类分出的不同类型的群体”。 但是所谓的指标具有明显的主观因素, 比如头颅的特征, 鼻子的特征, 肤色, 头发、眼睛的颜色等。 宗教人士、人类学家、社会活动人士等都可以根据这个定义而发展各自的理论。

费舍尔明确表示反对《宣言》的宗旨, 认为人种就是有高下的, 问题是如何和平共处。 他太有名了, 教科文组织在发表 1952 年版的《人种的概念》(The Race Concept) 时, 把费舍尔的反对言论附在后面, 供读者参考。

费舍尔不仅反对种族平等, 也反对戒烟。 他自己平时烟斗不离口, 在科学界开始发出戒烟的呼声后, 他连篇累牍地在《自然》杂志上发表文章, 指出肺癌与烟草的相关性不等于因果性 (单从相关性的逻辑上来说, 这并没有错), 然后说有烟瘾的人可能体内有一种什么东西, 跟没有烟瘾的人不同, 是这些天生的 “东西” 造成肺癌 (这就可笑了), 等等。 实际上, 他在背后得到了英国和美国几个大烟草公司的巨量好处。

本章主要参考文献

Dietrich, M. R. and R. A. Skipper, Jr. R.A. Fisher and the Foundations of Statistical Biology. Dartmouth Faculty Open Access Articles, 2013, 33.

Edwards, A. W. F. The Genetical Theory of Natural Selection. In: Perspectives: Anecdotal, Historical and Critical Commentaries on Genetics. Genetics, 2000, 154: 1419-1426.

Fisher, R. A. The causes of human variability. Eugenics Review, 1919, 10: 213-220.

Hartl, D. L., Fairbanks, D. J. Mud sticks: On the alleged falsification of Mendel’s data. Genetics, 2007, 175: 975-979.

McGrayne, S. B. The Theory that Would not Die. New Haven: Yale University Press, 2011: 320.

Moran, P. A. P. and C. A. B. Smith. Commentary on R. A. Fisher’s Paper on The Correlation Between Relatives on the Supposition of Mendelian Inheritance. Cambridge University Press, 1966: 61.

Provine, W. B. The Origins of Theoretical Population Genetics. Chicago: The University of Chicago Press, 2001: 209.

Visscher, P. M., and J. B. Walsh. Commentary: Fisher 1918 the foundation of the genetics and analysis of complex traits. International Journal of Epidemiology, 2019, 48: 10-12.