AlphaFold

DeepMind开发的人工智能程序
AlphaFold(阿尔法折叠)是由DeepMind开发的一款蛋白质结构预测程序。[4][3]借助AlphaFold,人类预测了几乎所有2亿种已知蛋白质的结构,并可以设计出人类自己的蛋白质。[3][5]
AlphaFold采用深度学习技术,有AlphaFold 1(2018)、AlphaFold 2(2020)、AlphaFold 3(2024)3个主要版本。[4][3]可以预测蛋白质或蛋白质-蛋白质复合物的结构,而是能够破解蛋白质与各种生物分子所形成的复合体结构及其相互作用。[1]主研团队DeepMind汇集了来自结构生物学,物理学和机器学习领域的专家,以应用技术根据其基因序列预测蛋白质的3D结构。[6]2018年,AlphaFold 1推出并在的CASP(蛋白质结构预测的关键评估)竞赛中排名第一,并成功预测了被评为最困难目标的蛋白质结构。[7][2]在“蛋白质结构预测奥运会”CASP比赛中,力压其他97个参赛者。《卫报》报道称,AlphaFold预测出了43种蛋白质中25种蛋白质的最精确结构。在同一类别中排名第二的队伍,只预测出了3种。[8]在2020年的CASP竞赛中,AlphaFold 2中位分数为92.4(满分100)。其准确度远高于其他任何程序。[9][10]2024年5月,AlphaFold3发布,将技术扩展到蛋白质折叠之外,能准确预测蛋白质、DNARNA配体等生命分子的结构及相互作用。[3]
AlphaFold被美国《科学》杂志评为2020年十大科学突破之一;[1]入围2021年中国工程院发布全球十大工程成就。[11]

研究背景

蛋白质通常由20种不同的氨基酸组成,可以被描述为生命的基石。[3]蛋白质是维持人们生命所必需的庞大而复杂的物质。人们身体的几乎所有功能,例如收缩肌肉、感知光线或将食物转化成能量等,都需要一种或多种蛋白质来完成。而蛋白质具体能做什么就要取决于它独特的3D结构了。[2]纯粹基于其基因序列推测蛋白质的3D结构是一项非常具有挑战性的复杂任务。这是因为人们的DNA通常只包含蛋白质中氨基酸残基的序列信息,而这些氨基酸残基形成的长链将会折叠成错综复杂的3D结构,加上蛋白质越大,需要考虑的氨基酸之间的相互作用就越多,对其结构的建模过程就会更加复杂和困难。[2]