evolutionaryscale 公司的 esm3 模型,在《science》杂志上发表的研究成果震惊科学界!这款蛋白质语言大模型,成功设计出超越自然进化范畴的功能性蛋白,其模拟的进化历程长达5亿年。
编辑 | 萝卜皮
ESM3 模型于2024年夏季发布预印本,历经半年,最终以“模拟5亿年进化历程的语言模型”为题正式发表。
研究人员利用海量进化数据训练 ESM3,使其能够生成远超已知蛋白质的功能性蛋白。ESM3 是一款先进的多模态生成语言模型,可以对蛋白质的序列、结构和功能进行综合推理。
图示:ESM3 的多模态推理能力。(来源:论文)ESM3 能够整合多种模态信息,响应复杂的指令,并具备高度的生物学一致性,从而提升模型的准确性。
图示:ESM3 用于PETase活性位点支架设计。(来源:论文)研究中,ESM3 成功设计了一种名为 esmGFP 的新型荧光蛋白。esmGFP 与现有最相似的荧光蛋白序列相似度仅为 58%,这在人工蛋白设计领域是前所未有的突破。通过引导 ESM3 关注荧光蛋白形成和催化色素体反应的关键序列和结构特征,经过多次迭代,最终获得了具有明亮荧光效果的 esmGFP。
图示:esmGFP 与已知荧光蛋白的对比。(来源:论文)esmGFP 不仅在序列上与已知蛋白差异显著,其荧光强度也与常用荧光蛋白相当。这项成果代表着跨越了超过5亿年自然进化历程的巨大飞跃。
关于 EvolutionaryScale 公司
EvolutionaryScale 是一家非营利性公司,致力于通过人工智能技术理解生物学,造福人类健康和社会。 他们秉承开放科学的理念,通过公开发布代码和模型来促进科学发展。该公司成立于2023年7月,已获得1.42亿美元种子轮融资,并与亚马逊和英伟达建立了合作关系。
论文链接: https://www.php.cn/link/756b7e381866fa63122100dd87543d6c
相关内容:https://www.php.cn/link/6bc7d9c600d61c08316607cde0dbb8a4 https://www.php.cn/link/55487d77a3826d9b920e0ee486ed99c3
以上就是模拟5亿年进化的ESM3在Science发布了,可推理蛋白质序列、结构和功能的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号