深度学习模型 DeepPBS:预测蛋白质-DNA 结合特异性的跨家族桥梁

aixo 2024-08-19 20:33:59
大模型 2024-08-19 20:33:59

该深度学习模型旨在捕捉蛋白质-DNA 相互作用的物理化学和几何背景,以预测结合特异性,表示为基于给定蛋白质-DNA结构的位置权重矩阵(PWM)。 跨蛋白质家族发挥作用,并充当结构确定和结合特异性确定实验之间的桥梁。

深度学习算法_深度学习_深度学习框架

图示: 用于预测跨蛋白质家族的结合特异性的性能。(来源:论文)

的输入不仅限于实验结构。蛋白质结构预测方法(包括、 和 )以及蛋白质-DNA 复合物建模器(例如 (RFNA)、 All-Atom、MELD-DNA 和)的快速发展,导致可供分析的结构数据数量呈指数级增长。

这一场景凸显了对用于分析蛋白质-DNA 结构的通用计算模型的需求日益增长。研究人员展示了 如何与结构预测方法结合使用,以预测没有可用实验结构的蛋白质的特异性。

此外,通过使用 反馈优化结合 DNA,可以改进蛋白质-DNA 复合物的设计。研究人员表明,此流程与最近的家族特定模型 相比性能相当,同时更具通用性:具体而言, 不受蛋白质家族限制,可以处理生物组装并可以预测 DNA 侧链偏好。

深度学习_深度学习算法_深度学习框架

图示: 在预测蛋白质-DNA 复合物结构中的应用。(来源:论文)

在可解释性方面,可以从 中提取与 DNA 相互作用的蛋白质中不同重原子的「相对重要性」(RI)分数。

作为对癌症发展有重要意义的蛋白质的案例研究,研究人员通过这些 RI 分数分析 p53-DNA 界面,并将其与现有文献联系起来进行验证。

并且, 分数与现有知识非常吻合,并且可以汇总以与丙氨酸扫描诱变实验产生合理的一致性。

深度学习_深度学习算法_深度学习框架

图示:以 p53-DNA 界面中 重要性分数的可视化为例进行研究,并进行实验验证。(来源:论文)

在额外的原理验证研究中,研究人员将 应用于针对特定 DNA 序列的计算机设计的蛋白质-DNA 复合物,该复合物来自最近一项结合结构设计与 DNA 诱变实验的研究。 也可用于分析分子模拟轨迹。

「对于研究人员来说,找到一种适用于所有蛋白质、而不局限于某个研究透彻的蛋白质家族的方法非常重要。这种方法还使我们能够设计新的蛋白质。」Rohs 说道。

深度学习框架_深度学习算法_深度学习

图示:将 应用于针对特定 DNA 序列的计算机设计 HTH 支架。(来源:论文)

当前版本的 存在固有的局限性。它是针对双链 DNA 量身定制的,尚不适用于单链 DNA、RNA 或化学修饰碱基。

然而,该模型有可能扩展以适应这些不同的场景以及其他聚合物-聚合物相互作用,并可能适用于机械突变。 架构可以在应用和工程增强方面进行优化和扩展。

尽管如此,Rohs 表示, 的应用将会非常广泛。这种新的研究方法可能会加速设计针对癌细胞特定突变的新药和治疗方法,并带来合成生物学的新发现和 RNA 研究的应用。

论文链接:

相关报道: