谷歌AlphaFold 3首发Nature,预测精准度提高100%,AI能帮助治疗癌症和免疫病|钛媒体焦点
刚刚,顶级科学期刊英国《Nature》(自然)杂志发表了一份重磅、突破性研究论文。
北京时间5月8日23点,谷歌DeepMind和其英国子公司Isomorphic Labs联合团队在《自然》杂志上发表一份共46页的重要成果,联合发布全新AI蛋白质结构预测模型AlphaFold 3,可准确预测生物分子相互作用的结构。
具体来说,新的AlphaFold 3拥有更强的生成式AI模型能力,效果全面提升。对于蛋白质与其他分子的相互作用,与现有预测方法相比,AlphaFold 3改进了至少50%;对于一些重要的相互作用领域,AlphaFold 3预测精(准确)度提高一倍(100%),可准确预测蛋白质、DNA、RNA、配体等的结构以及它们如何相互作用,有望帮助人们治疗癌症、免疫性疾病等。
稍早前举行的沟通会上,本论文共同监督作者、谷歌DeepMind联合创始人、CEO戴密斯•哈萨比斯(Demis Hassabis)对钛媒体App等表示,对于团队来说,AlphaFold 3的发布是一个重要的“里程碑”,同时也是用 AI 技术“理解和建模生物学”道路上迈出的重要一步。
“相比此前研究,AlphaFold 3不仅能够模拟蛋白质与其他分子的相互作用,而且还能准确预测包括DNA、RNA、配体等生物分子结构以及它们如何相互作用,从而能改变我们对生物世界和药物发现的理解,这非常重要。这是我们和Isomorphic共同正在推进的事情。我们非常自豪地在《自然》杂志新论文中宣布这些新突破发现、新结果和新方法。”Demis Hassabis表示。
六年超180万人的蛋白质数据库,AlphaFold 3模型预测精准再提升一倍
AlphaFold是由谷歌DeepMind开发的一款蛋白质结构预测程序,它采用 AI 和深度学习技术仅根据其基因序列就能预测蛋白质的3D结构,仅需数日内可识别蛋白质的形状,从而找到药物靶点,并有望推进产生新的小分子药物。
而在此之前,研发一款药物,通常需要数年时间、数亿美元的投入。
AlphaFold 1于2018年发布,其在CASP(蛋白质结构预测的关键评估)竞赛中成功预测了43种蛋白质中25种蛋白质的最精确结构,排名第一,并认为成功预测了最困难目标的蛋白质结构,引发全球的关注。
2020年,全新AlphaFold 2发布,并同步推出AlphaFold数据库,涵盖了人类和20种常用模式生物的35万个蛋白质结构,并且对98.5%的人类蛋白质结构进行了准确预测。同时,超过2.14亿个预测中约有35%被认为是高度准确的,这意味着它们与实验确定的结构一样好,另外45%被认为对于许多应用来说足够准确。
2022年7月,AlphaFold 2全面升级,DeepMind公司与欧洲生物信息研究所(EMBL-EBI)的合作团队宣布,基于UniProt数据库序列,AlphaFold预测出约100万个物种的2亿多个蛋白质结构,几乎涵盖了所有科学已知的蛋白质。相关研究成果发表在《自然》杂志上。
据Demis Hassabis披露的一份官方数据显示,截止目前,AlphaFold数据库用户已达180万人次,覆盖超190个国家,已查看的结构超600万次,论文和数据引用次数超过20000次。
谷歌DeepMind反复强调,通过减少缓慢而昂贵的实验的需求,AlphaFold可能为研究界带来了数亿年的进步,并节省了数万亿美元。数百万研究人员全球范围内已经使用 AlphaFold 2 在疟疾疫苗、癌症治疗和酶设计等领域取得了发现。