利用深度学习和结构域引导的结构信息,精准预测蛋白质功能
预测蛋白质功能对于理解生物机制和疾病治疗至关重要。然而,现有方法缺乏可解释性,难以揭示蛋白质结构与功能的关联。中南大学研究团队开发了一种名为DPFunc的深度学习模型,通过整合结构域信息,显著提高了蛋白质功能预测的准确性。该研究成果已发表在《自然通讯》(Nature Communications)杂志上。
DPFunc模型由三个模块构成:残基级特征学习模块、蛋白质级特征学习模块和蛋白质功能预测模块。 残基级特征学习模块利用预训练蛋白质语言模型(ESM-1b)和图神经网络(GCN),学习蛋白质序列和结构信息。 蛋白质级特征学习模块则整合结构域信息,通过注意力机制识别与功能密切相关的关键残基或区域。最终,蛋白质功能预测模块输出预测结果,并经过后处理以保证与基因本体论(GO)项结构的一致性。
研究结果表明,DPFunc的性能显著优于现有方法,尤其在预测信息量大、样本稀少的GO项方面表现突出。 DPFunc能够有效处理序列相似性低的蛋白质,并准确预测其功能。 此外,DPFunc还能有效识别酶的关键活性位点。 通过去除结构域注意力块,实验验证了结构域信息对模型性能的提升作用。
DPFunc利用蛋白质序列作为输入,通过预测结构域信息、提取残基特征和构建结构图来进行功能预测。 该模型的优势在于其对结构域信息的有效利用,以及对关键残基区域的精准识别,从而实现了对蛋白质功能的准确预测。 未来研究将着重于如何更有效地预测蛋白质在动态环境下的功能。
论文链接:https://www.php.cn/link/90ffcbb134728e25a7388a090d0ee80b
代码链接:https://www.php.cn/link/f8e64ef83e6f6881ceca3a3922921ddd
以上就是准确预测蛋白质功能新SOTA,中南大学推出全新深度学习模型,登Nature子刊的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号