第二十四章 近代太阳系模型的缔造人

利用数学来描述天体运行的想法最早来自于古希腊。 天文学家希帕恰斯 (Hipparchus of Nicaea, 约公元前 190一约公元前 120) 的太阳与月球的运动模型是现存最早的天文模型, 大约建立于公元前 150 年。 希帕恰斯首次借助古巴比伦的方法把天文仪器的圆周分为三百六十度。 他很可能也是天球仪的首创者, 并且已经很熟悉用经纬度的方法来描述天球上各点的位置。 300 多年后, 生活在罗马帝国治下埃及首都亚历山大城的托勒密集古希腊天文学研究结果之大成, 发表了著名的《至大论》 (Almagest), 首次建立了一套完整的 “宇宙” 模型, 用来描述恒星和行星的运动路径。 这里所谓的宇宙, 其实就是太阳系。

古希腊天文学家和哲学家认为, 所有天体的运行轨道都是正圆形的, 并且以恒定的速度围绕地球旋转。 这个假定主要源于古希腊哲学的宇宙观: 神创造的宇宙是完美的, 而最完美的几何形状是平面的圆和立体的球。 最早的行星模型 (一阶模型) 就是最简单的圆周运动。 图 24.1a 是一个简化的平面图。 在这个平面模型中只有两个参数: 行星 的经度 和圆周的半径 。 考虑到星体在三维球面上运动, 实际上还应该有一个参数, 就是描述 的纬度。 在当时的天文模型中, 假定所有星体都在同一个球面上运动。 这个模型只有经度和纬度两个参数, 因为 是不必确定的。

可是在实际天文观测中发现, 一些行星有明显的逆行行为, 也就是说, 从地球上观察, 行星的运行速度不均匀, 甚至在一些短暂的时刻, 行星似乎还在倒退。 为了解决这个问题, 希帕恰斯对一阶模型做了改进, 让行星 绕着点 作圆周运动, 同时 又绕着地球作圆周运动。 绕的小圈称为本轮, 绕的大圈称为均轮 (图 24.1b)。 为了满足天文观测的数据, 必须绕着 在每个恒星年里转一整圈。 这个二阶模型增加了三个参数: 本轮的半径 , 以及 在本轮上的经度和纬度。 以火星为例, 一阶模型同实际观测之间的最大角度误差高达 , 而改进后的二阶模型把误差减少到 , 但这个误差还是远远大于观测误差。

为了进一步改进模型的精度, 托勒密引入几个新的参数 (图24.1c)。 他把地球 从均轮的中心 移开, 点绕行的中心是 , 但 不再是均轮的圆心。 随着本轮的转动以 为中心转动, 称为偏心匀速圆 (Equant)。 偏心匀速圆的取向可以用经度角 来描述, 它是远地点经过转动中心 同横轴构成的夹角。 显然, 随着模型复杂性的增加, 参数的数目也相应增加, 为了减少参数, 托勒密假定 , 也就是说, 地球围绕着 点做圆周运动。 把这样的三阶模型用在火星上, 同观测数据之间的误差降低到 , 这已经接近当时观测数据的误差。 考虑到三维空间的运动轨道, 这个火星的模型需要 9 个参数, 其中有一个 (与地球的距离) 无法确定。 其他行星也可以类似地建立模型。 在这样的模型里, 每颗行星需要一组不同的参数来描述, 必须单独考虑。 比如, 水星的参数和火星的参数就非常不同, 水星的轨道的中点 远在地球 绕行的圈圈之外。

这个地心说的模型统治了欧洲天文界长达 1400 年, 随着观测精度的不断改进, 托勒密的模型越来越不能令人满意。 但是在上千年的时间里, 人们仍然执拗地遵从地心说和圆周运动的理论, 在本轮上再加本轮, 以改进模型的精度。 小圆圈越来越多, 这些改进使托勒密的模型失去了原本的简洁和美丽, 变得臃肿而繁复, 让人看了头晕。 图 24.2 就是一个例子。

01952687-d372-7abb-afcb-1fdad5b56c54_248_843_244_474_1008_0.jpg

图24.1 托勒密改进天体运行模型的示意图。 (a) 一阶模型, 行星 以地球 为中心作匀速圆周运动。 (b) 二阶模型, 行星 围绕点 作圆周运动, 点 以地球为中心作圆周运动。 (c) 三阶模型, 地球 偏离了 的圆周运行中心 , 在 之间来回游动, 而且 。 横轴是地球相对于天球上的春分点的方向。 点 是远地点在天球上的经度。

01952687-d372-7abb-afcb-1fdad5b56c54_249_305_243_471_512_0.jpg

图 24.2 1771 年《不列颠百科全书》总结的根据地心说模型所描述的太阳的周年轨道、 水星和金星分别在 7 年和 8 年中的表观运行轨道。

模型的参数越多, 拟合观测数据的误差越小。 但这并不能说明具有多个参数的模型比参数少的模型更接近于真理。 托勒密模型的复杂性, 尤其是相对于偏心匀速圆的匀速运动, 促使哥白尼放弃了以地球为中心的假定, 转而假定地球与所有其他行星都围绕太阳运行。 利用这个非常基本的假定, 他可以用两个圆周运动来表述在地球上看到的所有行星的复杂运动: 一个是地球相对于太阳的圆周运动, 一个是行星相对于太阳的圆周运动。 他甚至还猜测, 天体相对于地球的周日视运动是由于地球的自转。

哥白尼并没有质疑托勒密的多重圆周运动的假定。 他的太阳系模型实际上同图 24.1c的表述很类似, 只不过在他的模型里, 太阳取代了地球的位置 。 在比较天文观测数据时, 他的模型所描述的行星位置跟托勒密的模型具有类似的误差。 也就是说, 单从数学分析的角度来看, 哥白尼的日心模型对观测数据的拟合其实并不比托勒密的地心模型要好。

那么日心模型的优点在哪里呢? 第一, 哥白尼的模型对所有行星的逆行和其他一些现象给出了统一的解释。 其次, 地球的自转很自然地解释了天体相对于地球的周日视运动。 第三, 哥白尼的模型解释了行星的排列顺序, 并证明它们的运转周期随着离太阳距离的增加而增加。 哥白尼由此估算了五大行星的周期和距离, 而这些都是托勒密模型无法描述的。

第谷知道哥白尼的模型, 但是从宗教信仰的角度否决了它。 他建立了一个修正托勒密的地心模型, 本打算靠自己精确的观察数据来定参数, 可是没想到意外去世了。 如今, 除了专业天文学家, 他的模型已经几乎没人记得了。

同哥白尼一样, 开普勒 (图 24.3) 也是个极好的数学天文学家。 不同于哥白尼的是, 开普勒自己也做天文观测, 而且继承了第谷的当时最好的天文观测数据。 更重要的是, 他有一个关于天体运行的物理理论。 这个理论为他在探索更精确更简单的模型时提供了关键的导航作用。

通过仔细分析观测数据, 开普勒发现了三个重要定律:

  1. 行星运行的轨道是椭圆而非简单的圆形。 太阳位于椭圆的两个焦点之一。

  2. 从太阳到行星连一条直线, 直线在单位时间扫过的面积总是相等的。 这叫做等面积法则。

  3. 对所有的行星来说, 它们对应的比值 相等, 其中 是行星绕太阳一周的时间, 是轨道椭圆的半长轴。

这些定律是从观测数据得来的。 开普勒据此建立了一个物理模型 (图 24.4)。 他假定太阳的磁场同行星相互作用, 使它们沿椭圆形轨道运行。 他还假定行星运行的速度同它们与太阳的距离成反比, 以此来解释等面积法则。 这个物理模型后来被牛顿所更正。

开普勒在利用第谷的观测数据考虑火星相对于地球的表观运动的时候, 首先假定火星的轨道是圆的, 而且火星的速度与到太阳的距离成反比。 这两个假定都是错误的。 他在利用距离反比法则计算火星角速度时遇到困难, 解决这个问题需要微积分, 开普勒没有那

01952687-d372-7abb-afcb-1fdad5b56c54_250_836_243_480_607_0.jpg

图24.3 约翰尼斯·开普勒的肖像。 作者佚名。

01952687-d372-7abb-afcb-1fdad5b56c54_250_831_955_477_516_0.jpg

图24.4 开普勒的行星轨道模型。 椭圆有两个焦点, 太阳位于其中一个焦点。 不同的行星有不同的轨道, 但它们共有一个焦点, 也就是太阳的位置 。 在轨道不同的位置上行星与太阳的距离是不同的, 但是单位时间扫过的面积不变 (如 )。 个能力, 只能做近似。 不过在分析过程中, 开普勒幸运地发现了等面积法则。 利用这个法则, 他计算出火星的圆周轨道, 可这个轨道跟第谷观测的数据相比, 角弧度差了 8 分。 开普勒非常了解第谷的工作, 知道第谷的数据不可能有这么大的误差, 那么一定是模型错了。 这使他放弃了圆形轨道, 开始寻找类似卵形的轨道, 通过大量的计算, 终于发现椭圆轨道给出最佳的拟合结果。 表 24.1 给出了托勒密、哥白尼和开普勒建立的火星模型的参数数目和同观测数据相应的误差, 表中每个格子里有一对数值, 第一个是模型参数的数量, 第二个是模型相对于观测数据的误差。 从中我们看到, 虽然开普勒模型参数的数量还不到托勒密和哥白尼模型参数的一半, 可误差却减小了十倍以上。 显然, 开普勒的模型既简单又精确, 更重要的是, 他的模型对所有行星的处理方法是统一的。

表 24.1 托勒密、哥白尼、开普勒火星模型的参数总数与误差比较

模型经度纬度参数总数
一阶模型二阶模型三阶模型
托勒密$5;{52}^{ \circ }$11; ${13}^{ \circ }$16; 4°17; 2°31
哥白尼$6;{13}^{ \circ }$16; 4°15; 2°32
开普勒$6;{13}^{ \circ }$10; 10'4; 15'14

1609年, 开普勒发表了《新天文学》(拉丁文:Astranomia Nova)。 他以火星为例, 证明行星轨道应该是椭圆的。 对于其他行星, 他只是把从火星得到的结论做了推广。 开普勒的三大定律是经验的, 也就是说是通过含有误差的实际观测数据得到的, 而不是根据物理定律推论出来的。 这个工作要等到牛顿发表《自然哲学的数学原理》才得以实现。

10 年以后, 开普勒又发表了《世界的和谐》。 在这篇文章里, 开普勒报告了他的第三定律, 并且给出了各个行星到太阳的距离。 表 24.2 是他给出的每个行星的平均离日距离和轨道运行周期, 以及它们之间的比值。

我们可以看到, 最后一列中的比值 接近于一个常数。 在失妻丧子、母亲入狱的艰难日子里, 天文学是他生活中唯一的一片绿洲。 开普勒对这个发现极为激动, 他说:

表 24.2 开普勒的行星轨道平均离日距离、运行周期和它们之间的比值 (表中使用的是现代单位)

行星平均离日距离 $R$ (天文长度)周期 $T$ (天)${R}^{3}/{T}^{2}\left( {\times {10}^{-6}}\right)$
水星0.38987.777.64
金星0.724224.707.52
地球1365.257.50
火星1.524686.957.50
木星5.24 332.627.49
土星9.51010 759.27.43

“起初我以为自己是在做梦……但这个比值确实是个常数。 ”

这就是为什么他为自己的文章取名为《世界的和谐》。 他认为这个数学上的和谐是天意, 而且他发现了天体运行中音乐般的美妙, 他将之称为“天球的音乐”。

我们前面说过, 开普勒是 “幸运地” 得到了等面积法则。 为什么这么说呢? 因为 《新天文学》发表以后, 没有人能从其中给出的观测数据直接得到行星轨道是椭圆的结论。 就连直接接受开普勒三定律的牛顿也说: “开普勒知道轨道绝非圆形而是卵形, 他只是猜到轨道是椭圆的。 ”(“Kepler knew ye Orb to be not circular but oval & guest it to be Elliptical.” )观测天文学家们接受了开普勒的椭圆理论, 对宇宙体系的理解进入了一个新的阶段。 对测量方法和精度的关注变得越来越重要, 而使开普勒得到这个结论的那种对数据和理论的冗长思辨却没人再加以重视。 正如高斯 (Johann Carl Friedrich Gauss, 1777-1855) 后来所说, 对开普勒之后的天文学家来说, 他们所面对的问题已经不再是从数据当中推断出全然无知的因素, 而是如何改进已知的知识, 定义越来越狭窄的变化范围。 换句话说, 开普勒已经为传统天文学定下了基础。

开普勒的 “幸运” 揭示出通过实验数据来建立经验模型的重要基本原则。 这对科学家特别是专业建立模型的统计学者来说, 实在太重要了。 我们后面将要讲到, 高斯的拟合模型似乎可以同托勒密的模型相比较, 其灵活性几乎没有界限, 因为我们总是可以不断地以增加参数数目的方式来逼近观测数据。 但拟合的改进并不一定对了解问题的物理关系有实质性的帮助。 对统计学来说, 开普勒的模型建立极有指导意

义。 他的原理可以大致总结如下:

  1. 建立模型是一个渐进的过程, 从简单到复杂。

  2. 模型的复杂性取决于数学的模式和参数的数目。

  3. 从数学的角度来说, 模型通常应该简单、美观、和谐。

  4. 模型必须建立在物理理论的基础上。

  5. 在存在多个模型的情况下, 选择模型的判据是与观测数据的吻合程度。

  6. 以上原则在模型建立过程中的每一步都应该是互动的。 一个在数学形式下的多参数模型可能被另一个不同数学形式下的参数较少的模型所取代。

我们将看到, 这些原则对于现代科学研究仍然具有重要的指导意义。

本章主要参考文献

Hald, A. A History of Probability and Statistics and Their Applications before 1750. Willey Series in Probability and Statistics. New York: John Wiley & Sons, Inc., 1990: 586.

Wilson, C. Kepler’s Derivation of the Elliptical Path. Isis, 1968, 59: 4-25.