人工智能(AI)又一次获得了发展势头,它克服了生物学中的一个主要问题:预测蛋白质如何从线性氨基酸链卷曲成3D形状来执行任务。据美国“科学”网站11月30日报道,“蛋白质结构预测关键评估”(CASP)大赛日前收到好消息:英国“心灵深处”表示,其人工智能已取得上述成果,他们的方法将大大加快新药研发进程。
人体有数千种不同的蛋白质,每都含有几十到几百种氨基酸。这些氨基酸的排列顺序决定了它们之间的相互作用,赋予蛋白质复杂的三维形态,进而决定蛋白质的功能。了解这些三维形状将有助于研究人员设计能被困在蛋白质缝隙中的药物。此外,合成具有所需结构的蛋白质还可以加速酶的发展,有益于生物燃料领域。
几十年来,研究人员一直使用X射线晶体学或冷冻电镜等实验技术来破译蛋白质的三维结构,但这种方法可能需要数月甚至数年的时间,而且可能不会奏效。目前,在生命中发现的2亿种蛋白质中,只有17万种被破坏。
1994年,为了更好地预测和破译蛋白质的三维结构,马里兰大学结构生物学家约翰·穆特等人每两年发起一次CASP竞赛。在今年的比赛中,“深度学习”团队的阿尔法折叠法中位数为92.4分(满分100分,90分以上被认为与实验方法相当),预测最具挑战性蛋白质的平均分为87分,比次优预测高25分。它甚至擅长于预测细胞膜中蛋白质的结构,细胞膜是许多人类疾病的核心,但很难用X射线晶体学来研究。
欧洲生物信息学研究所名誉主任珍妮特·桑顿(Janet Thornton)说:“深度学习团队的成就令人惊叹,将改变结构生物学和蛋白质研究的未来。”
穆尔特说,这是一个有50年历史的问题,“阿尔法折叠”已经改变了游戏规则,而实验者也将如此能够利用精确的结构预测来理解不透明的X射线和低温电磁数据;药物设计者还可以快速阐明新冠状病毒等新兴危险病原体中每种蛋白质的结构,从而更快地开发相关药物。