第三十八章 对人类智慧的挑战

二战结束的第二年, 图灵提出了一种包含程序储存功能的计算机设计原理, 并把它命名为自动计算引擎 (Automatic Calculating Engine, ACE)。 有过 “巨无霸” 的经历, 图灵有十分的把握, 这个设计会成功。 可是由于英国官方对 “巨无霸” 严加保密, 图灵不能把这个事实讲出来, 图灵觉得自己的想法没有得到足够的支持, 于是离开了英国国家物理实验室 (National Physics Laboratory)。 有人怀疑图灵后来遭到迫害是政府有意为之, 因为担心他会把二战中的绝密信息泄露出去。 有些事恐怕我们永远也搞不清。

在美国, 计算机的研发则进展迅速。 1945 年, 一台电子数值积分计算机 (Electronic Numerical Integrator and Computer, 简称 ENIAC, 埃尼阿克) 在阿伯丁射击试验场的弹道研究所 (Ballistic Research Laboratory) 安装启动, 主要目的在于协助设计核武器。 埃尼阿克是以十进位制进行计算的机器, 利用大量的真空管和复杂的线路来完成计算。 1951 年, 离散变量自动电子计算机 (Electronic Discrete Variable Automatic Computer, 简称 EDVAC, 埃德瓦克) 在弹道研究所正式启动。 埃德瓦克是第一台使用二进制的计算机。 这台计算机是否参与了上篇第八章里鲍德温等人计算黑杰克概率的工作呢? 也许他们的真正任务是测试这台计算机的计算功能? 我们不得而知。

研发埃德瓦克的主要参加者之一是冯·诺依曼(John von Neumann, 1903-1957), 这是一位传奇式的人物。 他出生于奥匈帝国陪都布达佩斯的一个犹太家庭, 自幼就显示出非同常人的智力。 6岁时, 他便可以跟父亲用古希腊语交谈, 并心算八位数除法。 8 岁时, 他已经读得懂微积分。 15 岁时, 他找到布达佩斯最著名的分析学家攻读微积分。 19岁上大学之前, 他已经发表了两篇数学论文, 并获得匈牙利国家数学奖。 他喜欢数学, 想继续深造, 但父亲觉得数学不赚钱, 于是两人达成妥协, 年轻人先后到柏林大学和苏黎世联邦工业大学攻读化学工程, 可是他同时又在布达佩斯大学 (现在叫罗兰大学)注册了数学。 虽然他在布达佩斯大学没有上过一天学, 但在 1926 年, 他却同时获得苏黎世联邦工业大学的化学工程毕业证书和布达佩斯大学博士学位。 诺依曼恐怕是第一位远程大学的博士。 他的记忆力惊人, 可以把电话簿里的电话号码、人名、 地址准确无误地背诵出来。

1930 年诺依曼来到美国, 把名字从诺依曼 · 亚诺什(匈牙利语:Neumann Janos; 匈牙利人名跟中国类似, 姓在前, 名在后;亚诺什是典型的犹太名字)改成了德国风格的约翰·冯·诺依曼。 中间的 “冯” 是因为在他 10 岁的时候, 父亲被匈牙利政府授予世袭贵族头衔。 三年后, 他成为普林斯顿大学的终身教授。 30岁的教授在校园里常常被人误认为是研究生。 诺依曼比图灵大 9 岁。 1936 年, 在图灵探讨计算机的可能性的时候, 诺依曼正以普林斯顿数学教授的身份在剑桥大学访问。 第二年, 图灵到美国普林斯顿大学读博士, 诺依曼也回到那里教书, 两人对计算机的前景有过深刻的交流。

诺依曼 (图 38.1) 工作极有效率, 影响力甚广。 除了大量数学领域的贡献, 他还是量子逻辑的发明人、博弈论和数学统计学的前驱、数学经济学的开创者、“曼哈顿计划” 核武器研发的主要参与者。 在遗传学里, 他在发现遗传基因之前就建立了细胞自我复制的数学模型, 他的细胞自动机 (Cellular automaton) 理论在 1970 年代以后才得到遗传学界的重视。 而在电子计算机的发明史中, 他更占有非常重要的地位。 如果说图灵是计算机之父, 诺依曼不算之母至少也该算是接生婆。 在计算机算法和硬件的研发方面, 他是公认的奠基人。

但他绝不是一个死板的书呆子。 他不喜欢安安静静地工作, 不是用留声机大声播放德国军乐, 就是把电视机的声音开得大大的, 这很让他的同事如爱因斯坦和邻居们都非常反感。 他总是穿着最讲究的西装, 酷爱派对, 喜欢吃吃喝喝。 他妻子讽刺说, 诺依曼什么都算得对, 就是对卡路里怎么也算不清。 在普林斯顿, 诺依曼开车技术之烂是出了名的。 他一边开车一边读书, 所以连出车祸。 据说, 在 IBM 做访问教授期间, 邀请他访问的主人常常私下里把他的罚单付掉。

01952687-d372-7abb-afcb-1fdad5b56c54_401_306_1237_698_470_0.jpg

图38.1 约翰・冯・诺依曼和他的计算机。 他曾这样说:“如果说人们认识不到数学的简单, 那是因为他们不知道生命有多么复杂。 ”

1928 年, 也就是 25 岁的时候, 诺依曼发表过一篇有关博弈论的文章, 讨论 “零和游戏” (Zero sum games) 的策略和概率问题。 这是他概率统计研究的开端, 其意义远远超出牌类、棋类等游戏, 直接影响到后来经济学、心理学、社会学、人工智能以及政治军事战略的研究。

所谓 “零和游戏”, 简单地说是指两个人玩的游戏, 其中一个人的损失正好等于另一个人的获益, 二人的总和加起来永远为零。 诺依曼的理论证明, 在这种游戏里, 两个人总能找到对自己最适合的策略。 换句话说, 这种游戏没意思, 不好玩。 为什么呢?

诺依曼首先建立所谓的得分方阵 (Pay-off matrix)。 比如, 你和我玩一个零和游戏, 根据游戏规则, 我们建立如下的得分方阵 (表 38.1):

表 38.1 一种具有鞍点的假想的零和游戏的得分方阵

你的行动 $a$你的行动 $b$你的行动 $c$
我的行动 13-5- 2
我的行动 2698
我的行动 3- 16-3

你可以选择三种行动 中的任意一种, 我可以选择三种行动 中的任意一种。 表 38.1 中对应的数值是我赢 或输 的点数。 比如, 如果我选行动 2, 你选行动 , 对应着 “我的行动 2” 和 “你的行动 ” 那一格里的 8, 意味着我赢 8 个点, 也就是说, 你输 8 个点 (因为这是一个零和游戏)。 同样, “我的行动 1” 和 “你的行动 ” 意味着你赢 5 个点, 我输 5 个点。

怎样使用这个方阵来选择游戏策略呢? 它的基本思路是, 在最差的情况下争取最高的得分。 也就是说, 在对手做出他最高得分的行动时想办法使自己的得分最高。 具体来看, 如果我选择行动 1, 最坏的结果是 -5 ; 如果我选择行动 2, 最坏的结果是 +6 ; 行动 3 对我来说, 最坏的结果是 -3 ; 我避免风险的策略是, 把我的可能的最小得分尽量最大化。 所以我选择行动 2。

那你应该怎么办呢? 你也要把你的可能的最小得分尽量最大化。 表 38.1 是按照我的得分制作的。 我的得是你的失, 我的正分是你的负分。 所以, 按照表中给出的数值, 你需要把这些最大的点数最小化。 在 “你的行动 ” 那一列, 我得 +6 分对你来说是最坏的结果。 在行动 那一列, 我得 +9 分是你的最坏结果。 同理, 你的行动 那一列, 我得 +8 分是你的最坏结果。 所以对你来说, 把最坏的结果最小化, 意味着你选择行动 。 这对应着我选择的行动2。 我赢 6 分, 你输 6 分。

你和我根据各自利益选择的这个组合 (我的行动 2 和你的行动 ), 称为游戏的平衡点, 原因是在这样的点上, 游戏的双方都能保证损失最小, 所以双方都没有理由离开这个平衡点。 在更复杂的情况下, 这样的点叫做鞍点 (Saddle point)。 这是因为, 如果我的行动对应着变量 , 你的行动对应着 , 而我们共同的得分 的函数, 可以考虑成一个曲面。 我想得到曲面上最高的 “峰”, 而你要达到曲面上最低的 “谷”, 一个典型的这样的曲面如同马鞍 (图38.2), 鞍点也称为最小最大化点 (Minimax point)。 在表 38.1 的例子里, 我们的鞍点是 6, 也称为这个游戏的值。 总而言之, 如果游戏存在鞍点, 每个玩游戏的人就都能找到最佳策略, 并且即便向对手透露自己的策略也不会影响得分。

真正的游戏都不存在这样的鞍点, 不然根本玩不下去。 在分析了复杂的真正的游戏以后, 诺依曼引入概率并使用混合策略。 所谓混合策略, 是说游戏参与者的每一行动都是按照某种概率来进行的。 一个典型的例子是锤子、剪刀、布 (表 38.2)。

锤子砸剪刀, 剪刀剪布, 布包锤子。 这个方阵不存在鞍点, 因为我的行里的最低点 (-1) 不对应你的列的最高点 (+1)。 没有鞍点的最明显特点是, 假如我事先告诉你我下一步的选择, 你一定能找到一个选择来击败我。 这样的游戏不存在必赢的策略。

01952687-d372-7abb-afcb-1fdad5b56c54_403_304_1252_576_456_0.jpg

图 38.2 马鞍面 (蓝色曲面) 上的马鞍点 (红点)。 两个横坐标是 , 纵坐标是

表 38.2 锤子、剪刀、布游戏的得分方阵 (无鞍点)

我的选择你的选择
锤子剪刀
锤子0- 11
10- 1
剪刀- 110

诺依曼说, 对这样的游戏, 应该使用混合策略。 比如, 我用 的概率来分别选择锤子、剪刀、布, 然后计算利用这样的概率可以期望什么样的得分。 当然, 这需要在重复游戏很多次以后才能得到得分数的概率统计。 他证明, 任何一种二人玩的零和游戏都存在一种混合策略, 使二人期望的得分数值相等。 由于是零和, 两个人从概率上来说不能得到比这种期望值更高的得分。 而且即使你把你的策略明确告诉我, 我也占不到任何便宜。 这就是所谓的最小最大值定理 (Minimax Theorem)。 这个定理说, 每个游戏的参与者都可以选择一种策略, 使自己的最大损失极小化。

诺依曼后来说:在我看来, 没有这个定理很可能就没有博弈论。 我觉得在最小最大值定理被证明之前, 不值得发表任何文章。

1944 年, 诺依曼与经济学家摩根斯特恩 (Oskar Morgenstern, 1902-1977) 合作, 出版了一本书《博弈论与经济行为》(Theory of Games and Economic Behavior)。 这本书同时开创了博弈学和经济学的新领域。

计算机加上博弈论, 使概率统计发挥越来越广泛的作用, 迎接越来越多的挑战。

英国数学家乔治·布尔 (George Boole, 1815-1864) 最先看到, 数学可以用到逻辑思维分析当中去。 他试图把逻辑法则归纳成为简单的代数形式, 构建了著名的布尔代数。 他的《思维的法则》(The Laws of Thought), 成为研究人类大脑逻辑和概率思维功能的开端。 图灵、诺依曼和香农等人在研发电子计算机的过程中, 把人类的思维变成了计算。 于是, 一个自然的问题就出现了: 计算机能够最终取代人脑吗? 用什么方法可以使计算机挑战人类的智慧?

从第一台计算机问世起, 许多计算机科学家一直在考虑这个问题。 最早提出利用国际象棋来比较计算机和人脑功能的是香农。 他利用布尔代数的逻辑设计了电子线路, 用来进行计算。 他跟朋友到赌场去赌黑杰克(上篇第八章的故事)恐怕同研究计算机程序的思维能力不无关系。 在人工智能 (artificial intelligence, 简称 AI) 的研发过程中, 计算机国际象棋成为最广泛使用的实验技术测试对象, 被称为 “AI 研究的果蝇”(孟德尔的豌豆实验被人们注意以后, 遗传实验大多使用果蝇作为研究对象)。 起初人们只是利用业余时间写写象棋程序, 到了 1970 年, 美国计算机学会 (Association for Computer Machinery, ACM) 开始举办全国计算机象棋年赛。 这是计算机对计算机的比赛, 因为当时计算机的能力还不能够跟人直接对抗。

国际象棋跟中国象棋有不少类似之处。 棋盘由 8 行 8 列格子组成, 共有 64 个位置。 双方各有 16 枚棋子, 国王 (King) 和王后 (Queen) 各1 枚, 主教 (Bishop, 相当于中国象棋的象) 2 枚, 骑士 (Knight, 相当于中国象棋的马) 2 枚, 城堡 (Rook, 相当于中国象棋的车) 2 枚, 另外有阵前兵 (Pawn) 8 枚。 比赛时是持白者先走, 64 个棋盘位置的标号以白方为参考, 标记如图 38.3 所示。

开盘时, 白方的第一步有 20 种不同走法, 黑棋有同样多的走法相对应, 所以双方的第一步共有 400 种组合。 第二步之后, 双方棋子所有可能的位置的组合数陡然增加到 71852 种, 第三步以后的可能组合数为 9132484 种。 随着棋局的深入, 情况越来越复杂。 有数学家说, 把双方棋子位置所有的组合数都加起来, 可能有 种。 这个写法很多人可能看不懂, 它相当于 , 而这个 在 1 后面有 50 个 0。 我们把它展开写在下面: 你会发现, 它实在是很难读。 这个大得近于荒唐的数字, 按照一般人的经验, 很难感受它的大小。 有人认为, 整个宇宙的原子数的总和恐怕也没有这么多。 在这种近于无穷大的情况下穷举法毫无希望, 只能求助于概率加上诺依曼的最小最大化法则和混合策略。

01952687-d372-7abb-afcb-1fdad5b56c54_405_295_1188_517_523_0.jpg

图38.3 国际象棋的棋盘和棋子。 每个格子标有横向的字母和纵向的数字。 比如开盘之前白棋王后的位置是 , 黑棋王后的位置

我们先看一个简单的例子, 井字棋 (图 38.4)。 由于情况非常简单, 我们可以使用穷举法, 把所有可能的步骤都列出来。 这就是所谓的决策树 (在上篇第二章中分析八卦占卜时, 我们曾经采用类似的图来计算蓍草占卜时的各种可能性)。 在图38.4中, 最上面的一行是在游戏过程中间我的对手(MIN) 出子后的棋局 (他出的棋子用 表示)。 在MIN后面(第二行), 我 (MAX) 有 3 个选择, 也就是图 38.4 中的 2 ) 到 4 )。 对于我的每一个选择, MIN 有两个选择, 共 6 种选择, 即图中的 5 )到 10 ), 其中棋子位置 7)和 9)将把他的三枚棋子连成一行, 因而获胜。 所以, 按照最小最大化法则, 我必须选择2), 这样无论MIN如何最小化他的损失, 最终结果都是我胜, 见图中11)和12)。

在国际象棋的计算中, 也使用类似的决策树来分析每一步后面的可能性, 但我们无法穷举所有的可能性。 对于下一步到后面几步以至十几步会发生什么样的情况, 只能作概率上的预测。 实际上象棋大师们在下棋过程中也是在做预测, 只不过他们的预测跟数学物理模型有所不同, 含有许多直觉的因素。 怎样在每一步之后根据具体情况酌情改变预测, 从而改变战略和战术呢?答案是:使用贝叶斯概率。

01952687-d372-7abb-afcb-1fdad5b56c54_406_414_1133_771_510_0.jpg

图38.4 计算机在井字棋中对应对手的决策树分析方法。

1985 年, 刚刚进入卡耐基-梅隆大学计算机科学系博士站的华裔学生许峰雄 (Feng-hsiung Hsu) 和其他几个学生鼓捣起一台下国际象棋的计算机, 取名为 “芯测”(Chip Test)。 象棋大师本杰明 (Joel Benjamin, 1964- ) 也参与其中。 “芯测” 经过改进变成了 “深思” (Deep Thought)。 1988 年, “深思” 打败了丹麦象棋大师拉尔森(Bent Larson, 1935-2010), 这是历史上第一次计算机在真实博弈中战胜大师级棋手。

许峰雄在 1989 年得到博士学位后, 同他的队友一起进入 IBM, 目标直指当时的国际棋王、俄国人加里·卡斯帕罗夫(英文:Garry Kasparov, 1963-)。 卡斯帕罗夫是个传奇人物, 他在 1985 年至 2006 年间 23 次在世界国际象棋界排名第一。 许峰雄等人把 “深思” 改名为 “深蓝”, 改进芯片, 加快计算速度, 扩充大师棋局的数据库, 特别是卡斯帕罗夫的棋局, 并改进决策图的搜索功能。 这些数据库帮助 “深蓝” 预测后面棋局的走向。

经过 6 年多的努力, “深蓝” 与卡斯帕罗夫于 1996 年 2 月按照世界国际象棋比赛的规则正式交锋 (图 38.5)。 卡斯帕罗夫确信自己可以打败机器。 有人下了 50 万美元的赌注, 胜者拿 60%, 败者拿 40%。 卡斯帕罗夫大声嘲笑下注者: 他要赢得全部赌注。

第一局, “深蓝” 持白, 赢了卡斯帕罗夫, 第二局卡斯帕罗夫持白, 赢了 “深蓝”, 第三、四局双方同意为平局。 第五局, 在第 23 步时卡斯帕罗夫建议平局, 但最终战胜 “深蓝”。 最后一局, 他再一次战胜 “深蓝”。

赛后, 卡斯帕罗夫对 “深蓝” 表现出来的 “人性” 表示惊讶。 在最后一局里, “深蓝” 做了一个非常奇怪的决定, 它似乎毫无目的地移动了一枚城堡。 这个浪费的举动让卡斯帕罗夫非常不解。 更奇怪的是, 两步棋之后, “深蓝” 认输了。

01952687-d372-7abb-afcb-1fdad5b56c54_407_300_1249_545_456_0.jpg

图 38.5 1996 年 2 月 10 日, “深蓝”(左) 与卡斯帕罗夫(右)在费城首次交锋。

“那是一招奇妙的、极富人性的棋, ” 卡斯帕罗夫事后说, “我跟许多计算机打过交道, 但我从来没有这种感觉。 我能感觉到, 我能闻出来, 桌子对面是一种新的智能。 ” “深蓝”的举动让他感到震撼。

但事后卡斯帕罗夫在复盘的时候, 惊讶地发现, 实际上, “深蓝”已经算出来, 在那一招“臭”棋后面第 15 步, 城堡的位置变得非常重要。 可惜的是, “深蓝” 的数据库在接近棋局末尾的时候陷入一个 “黑洞” ——它没有现成的棋谱可以依靠了。 它看得够深够远, 但不够宽。 象棋大师卡斯帕罗夫临时的举措使 “深蓝” 束手无策, 只好认输。

虽然输了这盘棋, 电脑专家们反而更有信心了。 “深蓝” 可以看到棋局 20 步甚至更远的前景, 大师如卡斯帕罗夫, 一生只在一局当中看到过后面第 15 步。

第二年, 经过改进的 “深蓝” 同卡斯帕罗夫再次对垒。 这一次, “深蓝” 以二胜一负三平的成绩战胜对手。 打那以后, 卡斯帕罗夫再也没有战胜 “深蓝” 的机会了。 不久, IBM 拆掉了 “深蓝”, 许峰雄则加入了微软的北京亚洲学院, 在那里研发计算机围棋和日本将棋。

“深蓝” 还是有明显的 “硬算” 的特征。 它根据大师的棋局数据库, 依靠庞大的计算能力尽可能地计算每一步后面对手可能的招数。 但它所采用的最小最大化法则、决策树搜索、贝叶斯概率等概念, 现在被用来设计人工智能和机器学习 (Machine learning)。 2015 年, 一个名叫 Matthew Lai 的华裔加拿大籍学生从伦敦帝国学院 (Imperial College London)毕业。 他的硕士论文是利用机器学习理论建立一台自学国际象棋的计算机。 这台名叫 “长颈鹿” (Giraffe) 的机器在 72 小时之内, 就可以通过自学达到国际象棋大师级的水平。

“长颈鹿”的背后, 是所谓 “人工神经网络” (Artificial neural network, 简称 ANN) 技术。 它模仿大脑的神经网络结构和功能, 建立的数学模型或计算模型用于对函数进行估计或近似。 “长颈鹿” 的学习功能使它可以依靠象棋大师们过去的棋局来自我训练, 逐步完善对象棋的理解。 这种技术已大量用在图像识别、语音识别、机器翻译、社会网络的过滤、数码游戏、医学诊断, 甚至绘画等领域。 看起来, 在未来的世界里, 所有的机器皆含智能, 而所有的算法都离不开概率和统计。

那位赖同学后来加入谷歌下面的人工智能公司 “深心” (DeepMind)。 这个公司创造了一个以人的思维方式学习电子游戏的人工神经网络, 而且这个网络可以接入一个外部存储器, 就像一个传统的图灵机一样, 使得一台电脑可以模拟人类的短期记忆。 2014年, 他们研发出围棋计算机软件AlphaGo。

围棋远比象棋要复杂得多。 在棋盘的 361 个交叉点上, 第一个子可以下到任何一处。 相比之下, 象棋的第一步只有 20 种可能性。 随着棋局的开展, 围棋可能的下法比象棋多得太多了。 更重要的是, 象棋是毁灭性游戏, 开局时, 所有的棋子都在棋盘上, 随着游戏的进展, 棋子被对方吃掉, 数目不断减少, 游戏变得越来越简单。 相反, 围棋是建设性游戏, 开局时棋盘空空, 随着棋局的进展, 棋子越来越多, 每一子都可能影响全盘。

2015年, AlphaGo首次击败法国华裔二段围棋手樊麾, 2016年又战胜世界冠军、韩国专业围棋九段李世石。 在与李世石对局的第二局, AlphaGo在第37步下出一手所有职业棋手无法想象的棋, 令观棋者大惊, 继而望洋兴叹。 可是第四局第 78 步, 李世石也下出一手神棋。 AlphaGo大惑不解, 不得不重新 “思考” 战略, 搜索所有的决策树, 结果连续误算, 终于输了一局。 AlphaGo当时的状态和 “深蓝” 在与卡斯帕罗夫对弈时陷入的状态很相像。 不过, 从此之后 AlphaGo 棋艺更加精进。 2017 年 5 月, 世界冠军柯洁同改进后的AlphaGo交手, 连输三局。 据说, 在最后一局中盘的时候, AlphaGo 下出一步棋, 19 岁的柯洁浑身寒冷颤抖, 忍不住冲出对局室, 无力地说: “我赢不了, 我做不到!”

伴随着柯洁的啜泣声, AI把围棋带入一个崭新的时代。 人们恍然发觉, 三千年的皓首穷经呕心沥血, 对于围棋奥妙的理解却仍然仅仅限于皮毛。 柯洁的哭声或许也隐含着希望。 后来他说, 人类与人工智能联手, 将会开创一个新纪元, 共同发现围棋的真谛。 当然, 棋手的喜怒哀乐, 如醉如痴, 那种体验到美和奥秘的惊喜, 人工智能至少在短期内还是体会不到的。

2017 年, “深心” 推出 AlphaGo Zero。 这是一个全靠自学, 不采用任何人类数据的版本, 它比以前的版本都要强大。 通过跟自己对局, AlphaGo Zero经过 3 天的学习, 以 100比0的完美战绩超越AlphaGo Lee, 21 天后达到AlphaGo Master的水平, 40 天内超过所有之前的版本。

2018 年底, AlphaZero 出场。 它在 AlphaGo Zero 的基础上, 把算法延伸到日本将棋和国际象棋。

概率使人工智能在代表人类智慧的棋类博弈中具备了压倒性优势, 人类独尊棋类的时代成为过去。

又过了两年 (2020 年), 阿尔法折叠 (AlphaFold) 问世。 这一次, 人工智能直接跃入科学研究领域。 研究蛋白质结构, 对可能的结构进行预测, 这在生物学和医学领域占有非常重要的地位。 人类身体里存在几千种不同的蛋白质; 如果全世界的生物都考虑进来, 共有超过两亿种蛋白质。 而利用晶体结构理论, 经过全世界科学家 60 年的努力, 目前破解出的蛋白质结构只有 17 万种左右。

蛋白质的结构非常复杂, 每一种蛋白质包含数十到数百种氨基酸分子, 这些氨基酸的排列顺序决定了无数种氨基酸分子之间压缩和拉伸的方式, 导致蛋白质复杂的三维形状, 而这些蛋白质形状又决定了它们的不同功能。 对这些形状的了解, 可以帮助研究人员设计能够插入蛋白质内部缝隙的药物分子, 达到消灭病毒、医治疾病的目的。 但了解它们的结构一直是生物界和医药界的一大难题。 这个难题消耗了许多研究人员的毕生之力, 严重影响了对蛋白质功能以及药物对蛋白质影响的研究, 而后者是研发新药、治疗疾病的重要环节。

阿尔法折叠是专门用来分析、预测蛋白质折叠的人工智能网络。 所谓蛋白质折叠, 是蛋白质获得它的功能性结构和构象的物理过程。 通过这个物理过程, 蛋白质卷曲折叠, 构成具有特定功能的不同的三维结构。 阿尔法折叠拥有一个包括所有 17 万种已知蛋白质结构和卷曲折叠方式的数据库。 通过深度学习 (Deep learning) 技术, 阿尔法折叠利用贝叶斯原理, 像 AlphaZero 自学下棋那样, 通过数据库学习发现复杂的蛋白质结构。 2020 年 11 月, 在第 14 届蛋白质结构预测技术关键测试 (Critical Assessment of Protein Structure Prediction, CASP)比赛中, 阿尔法折叠在对蛋白质折叠结构分析的过程中战胜了 100 个科学团队, 以中位分数为 92.4 的成绩名列前茅。 比赛满分为 100 分, 90 分以上被认为预测方法可与实验方法相媲美。 阿尔法折叠预测最具挑战性的蛋白质的平均得分是 87, 比第二名的得分高出 25 分。 它甚至可以预测嵌入细胞膜的蛋白质结构。 细胞膜是许多人类疾病的核心, 但很难用X射线晶体学研究。 有专家对此评论说:“游戏规则从此彻底改变。 ”

本章主要参考文献

Shannon, C. Programming a computer for playing chess. Philosophical Magazine, 1950, 41: 256-275.

Silver, N. The Signal and the Noise: Why so Many Predictions Fail, but Some Don’t. New York: The Penguin Press, 2012: 445.