第十五章 格朗特的诸多 “第一”
前一章的故事被认为是流行病学 (Epidemiology) 诞生的正式标志, 可是那仅仅是格朗特 85 页的小册子里很少的一部分。 在这一章里, 我们谈谈他在其他领域的开创性结果。
人口和财产的普查从很早就出现了, 最初主要是为了税收和军队。 罗马共和国时代, 罗马城里的普查每5年进行一次。 进入罗马帝国时代, 普查扩展到整个帝国, 可是伴随罗马帝国的灭亡, 这种普查也在欧洲消失了。 系统的、全国性的普查要到 18 世纪以后才重新开始。 在中世纪和文艺复兴时期, 普查时有时无, 主要是为了收税。 对普查的数据进行统计分析出现得就更晚了, 因为巨量的数据只有在计算机出现以后才有可能进行分析。
“统计” (statistics) 这个词来源于意大利文。 在意大利语里, “stato” 是国家或政府的意思 (也就是英文的state), 而 “statista” 则是在政府里工作的人。 “statistics” 的最初含义, 是指专门为政治家所收集的一堆数据。 这个词最早出现在 16 世纪意大利的一些城市国家, 后来传入法国、荷兰和德国, 并从 17、18 世纪起成为欧洲一些大学的专门课程。 不过当时课程的内容主要是各国的宪法以及关于人口、经济、地理等方面的文字描述。 这个古典意义上的 “统计学” 从 19 世纪起就消失了。
文艺复兴时期, 意大利的一些城邦国家如威尼斯和佛罗伦萨开始系统地收集人口和经济的数值数据。 1662 年格朗特发表的分析则开创了一个新的学科, 不过把它正式称为 “统计学” 还是要等到 19 世纪呢。
格朗特对自己的结果信心十足。 在小书前面写给英国掌玺大臣罗伯茨 (John Roberts, 1606-1685) 的献词书信中, 他说自己对死亡报告的分析使他得到了许多结论, 比如:
……鼠疫期间患者隔离的措施给人们带来很大的不便, 而且缺乏实效;即使是最严重的鼠疫, 不论是伦敦还是全国, 其发作和消失的过程都很短暂;战争和殖民对男性的消耗并不能改变男女性别之间的比例; 把鼠疫同国王上台之类的事件联系起来的说法是错误的, 甚至是罪恶的;伦敦作为英格兰的大都会, 可能过于庞大, 使英格兰有点头重脚轻;伦敦的人口增长是全国的三倍, 这个头长得太快了; 教区已经变得完全不成比例; 我们的神庙已经不适合我们的信仰; 贸易和伦敦城都在逐渐往西移动; 伦敦老城只占伦敦的五分之一; 老的街道已经不适应满街奔跑的马车;能当兵的伦敦男人可以构成三支英格兰岛的军队; 等等…
很难想象能从一堆干巴巴的死亡数据中得出这么多有用的结论, 是不是? 下面, 我们就从几个例子看看他的统计学的思路和分析方法。
第一次准确估算伦敦的人口。
格朗特生活的时代, 不少人相信, 伦敦的人口在一百万左右。 有一天, 格朗特跟一位市政官聊天, 这位官员坚持说, 伦敦的人口已经有两百万了。 每人都有一个估计, 又都拿不出根据。 格朗特决定从死亡报告的数据里找答案, 并且以他特有的谨慎和缜密, 采用三种估算方法来相互印证。
第一是从正常死亡人数来估算。 我们在前一章里看到, 他从死亡报告得到的正常年份的平均死亡人数是 13000。 他还计算出, 正常年份, 平均每年每 11 个家庭里有 3 人去世。 假定一个典型的伦敦家庭有 8 口人:夫妇2人, 3 个孩子, 3 个仆人(包括付租金寄居的人), 于是他得到平均年死亡率为 3/88, 也就是 34%。 由此, 他估算出伦敦的人口是 38 万多人。
第二是从出生人数来估算。 他估计婴儿的平均年出生数在 12000 左右。 假设每一位成年妇女平均两年生一个孩子, 他估计有 24000 名孕龄妇女。 由此, 他估计伦敦的有生育能力的家庭数目大约是 48000 千。 按照平均 8 口之家来算, 伦敦的人口也是 38万多人。
第三是从伦敦的家庭分布来估算。 从伦敦的地图和平均每座房子所占的面积, 他得到每 100 平方码居住 54 个家庭。 当时的伦敦老城, 城墙里大约有 22000 平方码, 由此他得到老城里的家庭数目是 12000 千。 从死亡报告来看, 老城里的死亡人数是总死亡人数的 1/4, 那么, 伦敦的总家庭数目是 48000 千。 这样得到的伦敦总人口还是 38万多人。
这种吻合程度似乎过于圆满了。 但格朗特异乎寻常地坦率, 他把所有的假定和逻辑步骤都清晰地写出来, 供读者评判。
第一次估算伦敦人口的增长和城市的变迁。
格朗特发现, 相比于 1605 年, 伦敦老城城墙里面的 97 个教区在 1659 年的正常死亡人数几乎翻了一番 (确切的比值是 1.7)。 城墙之外, 仅靠着城墙的 16 个教区, 1659 年的正常死亡人数是 1605 年的 2.3 倍。 更远郊的 10 个教区的增长率则高达 4.5 倍。 把所有郊区的数据放在一起平均来说, 1659 年的正常死亡人数是 1605 年的 2.5 倍。 正常死亡率的变化反映了人口的变化。 格朗特得出结论, 伦敦的人口在 50 年里翻了一番还多。 从这些数据还可以看出, 老城里面已经饱和, 没有建造新房屋的空间了, 所以人口增长相对缓慢。 远处的教区多数在伦敦的西郊, 那里是有钱人盖大房子的地方, 人口增长得也快。
他还估算了伦敦的移民人口, 结论是, 17世纪上半期, 每900名伦敦市民里就有一位新移民, 平均每年增加移民 6600 人。
第一次估算人口的性别比例。
格朗特还利用死亡报告列出的新生儿和死者的性别, 计算了它们对应的性别分布。 除了伦敦以外, 他还找到一个小城罗姆西 (Romsey) 的数据, 用来作为对比。 他在小册子里给出的比例都是近似的分数, 为了使读者读起来方便, 这里都改成小数了。 他发现, 从 1629 年到 1660 年伦敦的受洗婴儿记录里, 男婴对女婴的平均比值是 1.074。 而罗姆西的记录涵盖的年代要长很多。 从 1569 年到 1658 年这 90 年里, 那里男婴对女婴的平均比值是 1.06。
这两个比值很相近。 但这样得到的比值可靠吗? 格朗特说, 伦敦人似乎生男婴多一些, 但他又不很确定。 他接着又说, 也可能在其他什么地方, 生女婴的要多一些。 这实际上牵涉到统计学中的取样问题。 从他给出的数据来看, 罗姆西的数据量太小了。 比如, 伦敦8年的婴儿受洗人数有65000人左右, 而罗姆西只有700人。
为了检查婴儿性别比例的结果, 格朗特还研究了死亡者的性别比例。 他发现, 在 1629 年到 1660 年的同一个时期, 男性死者对女性的平均比例是 1.098。 由此, 他说, 伦敦出生婴儿男孩对女孩的性别比是 16 比 15。 他没有讨论为什么死亡的男女比例似乎比出生的比例还要大。
人类历史上第一张生命统计表 (Life table)。
所谓生命统计表, 在现代意义上, 是关于某个国家或地区人们生存的一些概率信息。 这包括表达 “正常人” 从某个年龄到下一个生日前死亡的概率和在每个年龄的预期寿命。 这里所谓 “正常人” 是根据大量统计数字得到的具体到个人的平均值。 这个表格对现代生活具有非常重要的意义。 社会管理和医疗、生命保险以及国家福利的各种决策在很大程度上取决于这个表格。
格朗特是最先构建生命统计表的。 他的最初目的是要为英国军队提供一个兵源的可靠信息。 从 16 世纪到 17 世纪, 英国战争不断。 在格朗特的有生之年, 几乎年年打仗。 比如, 1625-1630年英国-西班牙战争, 1627-1629年英法战争, 1642-1651年英格兰内战, 1652-1654年英国-荷兰战争, 1654-1660年英国-西班牙战争等。 伦敦有多少男人能当兵出去打仗? 整个英格兰有多少人可以当兵? 这是英国政府最重视的问题之一。
格朗特还是从他的死亡报告数据出发。 当时英国的兵役年龄在 16 岁到 56 岁之间。 要想估计在这个年龄范围内的男人的数目, 他需要利用死亡数据来构建人口数目随年龄变化的数据。 这看来是不可能做到的事情, 但格朗特找到了一个途径: 他可以从死亡数据里找出儿童和老年人的人口分布。 一旦知道了两头, 中间的空隙就可以利用一些假设填补起来, 类似于内插, 应该不会相差太多。
在前面提到的 20 年里的 229 250 个死亡人数中, 怎样知道究竟有多少是孩童呢? 格朗特在小册子里给出详细的分析思路。 他先把死亡报告中各种跟婴幼儿联系比较紧密的疾病列出来, 比如鹅口疮、惊厥、佝偻、牙病、寄生虫病等, 一共有71124人, 他假定这些死亡的都是儿童, 而且在 4 岁到 5 岁以下。 换句话说, 儿童占总死亡人数的三分之一。 再考虑到其他传染性疾病, 如天花、水痘、麻疹等等, 死亡记录里有 12210 人。 他假定其中有一半 (6105人) 是 6 岁以下的儿童, 于是得到儿童死亡人数为 77229。 从这里他估计, 6岁以下儿童约占死亡总人数的 34%。 如果把有记录的堕胎和死胎人数 (8559) 也包括在内, 那么儿童死亡比高达37%。 把两个数平均起来, 大约是36%。
儿童死亡竟然占了总死亡人数的 1/3 还要多, 这是一个非常高的比例。 在 17 世纪的医疗和卫生条件下, 这样的比例是可以理解的。 格朗特从这里出发, 认为从这个比例可以推论出存活儿童的比例。
死亡记录里, 记录为 “老年” 的死者有 15757人, 是总死亡人数的 7%。 可是记录里没有年龄的数据, 这使他无法得到可靠的死者年龄分布。 他假定 66 岁以上的人占总人口的 3%, 76岁以上的只占 1%。 于是他做出如下结论:
“由此我们发现, 在 100 个出生的儿童中, 36 个会在 6 岁之前死去, 而也许只有一人活到 76 岁。 在 6 岁和 76 岁之间有 6 个十年, 我们寻找一组把 64 个幸存者在这 60 年里成比例变化的数值。 死亡不会精确地按照比例发生, 所以这些数值应该足够地接近真实情况······”
然后, 他给出了 100 个新生儿每十年的死亡人数表 (见表 15.1)。
表 15.1 格朗特的生命年表
| 年 龄 | 死亡人数 | 存活人数 |
| $0 - 6$ | 36 | 64 |
| 6—16 | 24 | 40 |
| 16—26 | 15 | 25 |
| 26—36 | 9 | 16 |
| 36—46 | 6 | 10 |
| 46—56 | 4 | 6 |
| 56—66 | 3 | 3 |
| 66—76 | 2 | 1 |
| 76—80 | 1 | 0 |
| 80- | 0 | 0 |
以今天的眼光来看, 那真是一个很残酷的年代。 每 100 个新生儿, 到 16 岁时只剩下 40 个, 而到 26 岁时, 只有 25 人了。
这种估计可靠吗? 1899 年, 有人分析了意大利城邦热那亚从 1601 年到 1700 年整整 100 年的死亡数据, 发现按照 100 个儿童出生的比例, 到 7 岁的时候, 有 57 人幸存。 这同格朗特的估计相差不远。 不过往后的差别越来越大。 热那亚的数据显示, 幸存人数在 17 岁时是 48 人, 27 岁时是 40 人, 47 岁时是 26 人, 67 岁时是 11 人。 也许, 格朗特的估计有点过于悲观了, 但也许这就是当时英国的现实。 在当时的医疗卫生和生活环境下, 热那亚的气候远比伦敦更适合生存。
从表 15.1, 格朗特通过伦敦人口和男女比例的 16/15 得到男性的人数, 然后计算他想要的兵役人数, 也就是 16 岁到 56 岁的男性人数。 但他犯了一个简单的计算错误, 他说 100 个出生男孩里, 存活于 16 到 56 岁之间的人数是 34。 显然他是把死亡人数错当成存活人数了。 不过这已经不重要了, 关键是这个崭新概念的出现。 这张表还有许多信息, 格朗特自己还没有意识到, 这要等后来者来发现了。 在小册子的末尾, 格朗特说:
“关于所有这些问题, 还有其他更多问题的清晰的知识, 可以使政府的管理更加仁慈, 更加通融, 更加到位。 这些知识还可以平衡政党以及教会同国家之间的关系。 ”
1665 年, 也就是格朗特小册子出版第三版那一年, 伦敦出现了最后一次鼠疫。 从那以后, 鼠疫再也没有在伦敦大面积蔓延过。 这跟格朗特的小册子有关系吗? 也许他的分析指出, 鼠疫的蔓延同环境的变化有密切关系。 也许政府开始大力控制疾病传染期出入感染地区的人流了。 不过这些都只是猜测而已。
1665 年的鼠疫是从 6 月开始的, 3 个月之内, 伦敦的人口减少了十分之一。 鼠疫从伦敦向城外蔓延, 英国王室不得不逃到牛津暂住。 市内的有钱人携家出逃, 一些政府的工作人员也逃走了。 城里面, 有鼠疫病人的家庭都用红粉打上了十字标记。 到了第二年, 疫情逐渐变缓。 可是 1666 年 9 月 2 日凌晨, 布丁巷的一个面包房起火。 布丁巷位于伦敦旧城拥挤地区的中心, 也是附近市场的垃圾堆放地。 火灾发生后, 伦敦市长很快就接到了失火通知, 但因为是星期日, 他没有心情工作。 到了下午, 大火已经烧到泰晤士河畔, 无法控制 (图 15.1)。 大火连烧了 4 天, 使得整个伦敦老城 13200 家住户无家可归, 87个教区的教堂被烧毁, 300公亩的土地化为焦土。
这场大火把格朗特的布店完全烧毁, 使他彻底失去了经济来源。 也就是在这期间, 这个特立独行的人突然宣布皈依天主教。 他家祖上都是新教徒, 周围的朋友也是新教徒。 这个决定使他丧失了几乎所有的朋友。 几年后, 格朗特因黄疸和肝病去世, 终年54岁。

图 15.1 1666 年的伦敦大火。 一位无名画家 1675 年的作品。 画面的左边是伦敦桥, 右边是伦敦塔, 正对着大火的是圣保罗大教堂。
本章主要参考文献
Glass, D. V. John Graunt and his natural and political observations. Proceedings of the Royal Society of London. Series B, Biological Sciences, 1963, 159: 2-32.
Graunt, J. Natural and Political Observations Mentioned in a following Index, and made upon the Bills of Mortality, 1662. http://www.neonatology.org/pdf/graunt.pdf.Text converted by Ed Stephan from Reprint Edition of 1975, produced by the Arno Press Inc., New York, under the general editorship of Lewis A. Coser, reprinted from a copy in the University of Illinois Library.
Hald, A. A History of Probability and Statistics and Their Applications before 1750. Willey Series in Probability and Statistics. New York: John Wiley & Sons, Inc, 1990: 586.
Morabia, A. Epidemiology’s 350th Anniversary: 1662-2012. Epidemiology, 2013, 24: 179-183.
Slavin, P. Death by the lake: Morality crisis in early Fourteenth-Century Central Asia. Journal of Interdisciplinary History, 2019, 50-59-90.