谷歌DeepMind祭出蛋白质设计新AI,有望攻克癌症!蛋白亲和力暴增300倍

新智元报道

编辑:编辑部

【新智元导读】今天,DeepMind又发布了Alpha模型家族的新成员,堪称是「专精版」的AlphaFold,专注于设计蛋白质结合剂,将大幅减少所需的实验室工作,提升开发效率。

DeepMind「阿尔法」家族,再迎新贵。

谷歌开发者负责人Logan昨日的一句话,勾起了全网好奇心。

「如果你认为AI进展正在放缓,那就说明,你并没有密切关注它」。谷歌究竟有着什么大事,等着我们?

刚好今天,谷歌DeepMind祭出了AI设计蛋白的新模型——AlphaProteo,再次在AI圈里掀起海啸级地震。

它可以为不同的目标蛋白,设计新的蛋白结合剂,能够为癌症、糖尿病并发症相关的VEGF-A。

这也是,AI工具首次能够为VEGF-A,设计出成功的蛋白结合剂。

在7种靶标蛋白测试中,AlphaProteo比现有的方法,实现了3-300倍的蛋白结合亲和力。

它还大幅提升了研究效率,将实验室数年工作,压缩至几天甚至是几周之内。

AlphaProteo的意义在于,可以预防病毒感染,设计抗癌,等各种治愈疾病的药物。

通过蛋白结合剂紧密附着在「病毒」、「癌细胞」上,阻止它们之间的信号传递,扰乱其功能,最终走向死亡。

网友们纷纷感慨道,AI+生物学又一次突破,对于挽救人类生命来说意义重大。真不知道,医疗保健在未来5-10年,会是什么样子?

在AI4Science上,谷歌DeepMind只会投入更多。

「阿尔法」家族的进阶

AF3的诞生,意味着将会开启更多变革性的科学研究,比如基因组学研究、加速药物设计、新材料开发、培育作物等等。

要知道,2020年发布的AlphaFold 2已经引起了科学界的轰动。

由于在蛋白质结构预测上取得了根本突破,全球目前有数百万研究人员使用AF2来研制疫苗、治疗癌症或设计蛋白酶。

而走出「蛋白质世界」,能够预测所有生物分子的AF3,预计会给各领域的科学发现带来更大的变革。

尽管AlphaFold系列模型已经取得了这些成就,团队领导人John Jumper还是经常被「催更」。

比如,有人希望扩展AlphaFold的预测功能,直接针对能改变蛋白质功能的修饰,让模型更好地辅助药物设计、疾病理解等领域。

虽然Jumper在采访中经常表示「很无奈、做不到」,但DeepMind显然看到了这一层需求。

最新发布的模型AlphaProteo,就是瞄准了这些领域的实际应用,旨在设计出能成功结合目标分子的蛋白质。

博客地址:https://deepmind.google/discover/blog/alphaproteo-generates-novel-proteins-for-biology-and-health-research/

学习蛋白质的相互结合

从细胞生长到免疫反应,人体的每一个生物过程都依赖于蛋白质的之间的相互作用。

蛋白质的结合具有一个重要性质——特异性,就像钥匙和锁。「锁齿」对不上,蛋白质就无法结合并发挥作用。

关于这类过程的原理和机制,AlphaFold等结构预测工具可以为我们提供很多见解,但还不能创造出新的蛋白质来直接操纵这些相互作用。

想创造出能结合目标分子的蛋白质,这项工作目前还只能交给科学家完成。

这类「蛋白质结合剂」可以加速许多领域研究的进展,包括药物开发、细胞和组织成像、疾病理解和诊断,甚至是提升作物抗虫性。

尽管机器学习方法在蛋白质设计方面取得了重大进展,但这一过程仍然繁琐且复杂,传统方法耗时费力。

不仅设计过程本身难度很大,需要多轮的广泛实验测试;结合剂被成功制造出来之后,还需要进行额外的实验来优化结合亲和力,以便能和目标蛋白结合得足够紧密、发挥作用。

而今天推出的AlphaProteo就是专门用于设计高强度蛋白质结合剂, 有助于药物发现、开发生物传感器等应用

实验发现,AlphaProteo适用于多种目标蛋白,比如与癌症和糖尿病并发症相关的VEGF-A,这是AI工具首次为VEGF-A成功设计出蛋白结合剂。

此外,在测试的其他7种目标蛋白上,相比之前的最佳方法,AlphaProteo的实验成功率更高,且蛋白质的结合亲和力有3~300倍的提升。

团队同时放出了一篇论文,详细介绍了湿实验的流程与验证结果。

论文地址:https://storage.googleapis.com/deepmind-media/DeepMind.com/Blog/alphaproteo-generates-novel-proteins-for-biology-and-health-research/Protein_Design_White_Paper_2024.pdf

AlphaProteo的训练数据包括Protein Data Bank(PDB)和AlphaFold生成的超过1亿个预测结构。

通过训练,AlphaProteo学习到了蛋白质分子相互结合的方式。给定目标分子的结构以及优先结合位点,模型就能生成在相应位点结合的候选蛋白质。

预测的蛋白结合剂与目标蛋白质相互作用的示意图,蓝色部分为AlphaProteo生成的蛋白结合剂结构,黄色部分为目标蛋白质,即SARS-CoV-2刺突受体结合域

但遗憾的是,博客和文章都没有提到AlphaProteo的模型架构或具体训练方法,目前也没有放出代码或模型权重。

成功结合关键蛋白

为了测试AlphaProteo,团队在7种目标蛋白质上进行了测试,包括:

- 2种与感染有关的病毒蛋白:BHRF1和SARS-CoV-2刺突蛋白受体结合域SC2RBD

- 5种与癌症、炎症和自身免疫性疾病有关的蛋白质:IL-7Rɑ、PD-L1、TrkA、IL-17A和VEGF-A

结果显示,AlphaProteo具有极高的结合成功率和同类最佳的结合强度。

它成功地在计算机模拟中生成了候选蛋白质,并在实验中实现了与目标蛋白质的紧密结合。

AlphaProteo为以上7种蛋白质生成了结合剂,蓝色是在湿实验室中测试的结合剂示例,黄色部分是目标蛋白质,深黄色部分突出显示了预期的结合区域

对于病毒蛋白BHRF1,候选分子成功结合的比例高达88%,比现有的最佳设计方法高出10倍。

候选蛋白的结合成功率提高,意味着需要更少的测试,就能找到成功的结合剂,可以大大缩短实验周期,降低研发成本。

AlphaProteo对7个目标蛋白质的输出结果在体外实验中的成功率

对于另一个目标蛋白TrkA,AlphaProteo设计出的结合剂甚至胜过了先前最佳的、经过多轮实验优化的结合剂。

在没有实验优化的情况下,AlphaProteo对7个目标蛋白质设计结果的最佳亲和力,较低的亲和力意味着与目标蛋白结合得更紧密

验证结果

除了自己开展的实验,DeepMind还邀请了英国王牌研究中心、欧洲最大的生物医学研究机构——弗朗西斯·克里克研究所(Francis Crick Institute)来进行验证。

在不同的实验中,团队更深入地研究了两种目标蛋白,SC2RBD和VEGF-A的结合剂。

结果显示,这些结合剂的结合相互作用确实与AlphaProteo的预测相似,并且具备有效的生物功能。

例如,SC2RBD的蛋白结合剂被证明可以阻止SARS-CoV-2及其部分变种对细胞的感染。

然而,由于AI的局限性,AlphaProteo对一种目标蛋白无能为例,即与类风湿性关节炎等自身免疫性疾病相关的TNFɑ。

但值得注意的是,计算分析显示针对TNFɑ设计结合剂极具挑战性,而这也是DeepMind用它来进行测试的原因。

通常来说,实现强结合只是设计蛋白质结合剂的第一步,在研究和开发过程中还有许多生物工程障碍需要克服。

而AlphaProteo可以大幅减少初步实验所需的时间,并适用于广泛的应用。

蛋白设计是一项快速发展的技术,在多个领域都具有很大的科学潜力,比如理解疾病的致病因素、在病毒爆发中加速诊断测试的开发、支持可持续的制造工艺,甚至清除环境污染物等方面。

DeepMind提出,未来不仅会与学界合作,利用AlphaProteo解决具有影响力的生物学问题并了解其局限性,而且还会和Isomorphic Labs合作,探索药物设计方面的应用。

同时,团队还将将继续提高AlphaProteo算法的成功率和亲和力,扩大其可以解决的设计问题范围,并与机器学习、结构生物学、生物化学和其他学科的研究人员合作,开发出负责任且更全面的蛋白设计方案。

参考资料:

https://deepmind.google/discover/blog/alphaproteo-generates-novel-proteins-for-biology-and-health-research/