首页 > 资讯
50年难题被攻破,蛋白质3D结构可用AI解析
众创网2020-12-03

生物学界最大的挑战之一——蛋白质三维结构解析如今有望被破解。

人工智能(AI)攻克了生物学领域一项重大难题:预测蛋白质如何从线性氨基酸链卷曲成3D形状以执行任务。据美国《科学》杂志网站11月30日报道,“蛋白质结构预测关键评估”(CASP)竞赛传来喜讯:英国“深度学习”(DeepMind)称其AI实现了上述成就,他们的方法将极大加快新药研发进程。

如果把生物体比作工地,那么蛋白质就是工地上的砖头。人体内有成千上万种不同的蛋白质,每种蛋白质包括数十上百个氨基酸,这些氨基酸的顺序决定着蛋白质的形状和功能。“结构即功能”是分子生物学的定理,若能根据根据蛋白质的氨基酸序列推出其结构,有助于人们加速了解细胞的组成和运作规律,一些新药物的研发也能更快推进。

长久以来,人们需要借助实验确定完整的蛋白质结构,比如X射线晶体学和冷冻电镜,这些方法往往需要数月甚至数年时间,目前人类已发现的2亿蛋白质中,只有不到20万的结构被解析。

几十年来,研究人员利用X射线晶体学或低温电子显微镜(cryo-EM)等实验技术来破译蛋白质的三维结构,但这种方法可能需要数月甚至数年,且未必见效。目前,在生命体内发现的2亿多个蛋白质中,只有17万个蛋白质的结构被破解。

1994年,为更好预测和破解蛋白质三维结构,马里兰大学结构生物学家约翰·穆尔特等人发起了CASP竞赛,每两年举行一次。

而现在,人工智能也有能力给出精确预测的计算方法,甚至只要几天甚至半个小时。近日,在蛋白质预测结构挑战赛CASP上,DeepMind推出的AlphaFold程序在百余支队伍中脱颖而出。CASP的比赛规则之一是参赛者预测的蛋白质结构必须已经通过实验验证但未公开发表。预测出的结果会通过实验方法进行匿名检验,二者相似度越高,得分也就越高。

在今年的比赛中,“深度学习”团队的“阿尔法折叠”(AlphaFold)方法的中位分数为92.4(满分100分,90分以上被认为预测方法可与实验方法相媲美),预测最具挑战性的蛋白质的平均得分为87,比次优预测高出25分。它甚至擅长预测嵌入细胞膜的蛋白质结构——细胞膜是许多人类疾病的核心,但很难用X射线晶体学研究。

比赛中,DeepMind的AlphaFold将深度学习与张力控制算法结合,并应用于结构和遗传数据,该深度学习网络利用目前已知的170,000种解析完毕的蛋白质进行了训练。结合蛋白质折叠的物理结构和几何约束信息,AlphaFold可以预测出目标蛋白质的序列结构——甚至还包括楔入细胞膜的蛋白质,这是理解许多人类疾病的关键。

但AlphaFold也不是十全十美,比赛中,在预测一个由52个小重复片段组成的蛋白质结构时,AlphaFold拿到的分数并不高。目前,DeepMind已经公布了AlphaFold首个版本的详细信息,以便其他研究者复制使用。DeepMind有关研发团队表示,还将继续对AlphaFold展开训练,以便更好地解析更复杂的蛋白质结构。

欧洲生物信息学研究所名誉主任珍妮特·桑顿说:“DeepMind团队所取得的成就是惊人的,这将改变结构生物学和蛋白质研究的未来。”

穆尔特则表示,这是一个有50年历史的问题,“阿尔法折叠”改变了游戏规则,实验学家将能使用精确的结构预测,来理解不透明的X射线和低温电磁数据;药物设计者也可借此迅速厘清新冠病毒等新冒出的危险病原体中每种蛋白质的结构,从而更快研制出相关药物。

阅读:
分享
用微信扫描二维码分享
请点击右上角分享给微信朋友或朋友圈