Command Palette

Search for a command to run...

2 个月前

FusionProt:融合序列与结构信息的统一蛋白质表示学习

Dan Kalifa Uriel Singer Kira Radinsky

FusionProt:融合序列与结构信息的统一蛋白质表示学习

摘要

蛋白质在生物过程中发挥着至关重要的作用,深入理解生物体内复杂的调控机制离不开对蛋白质的精准表征。准确的蛋白质表示对于药物研发、合成生物学以及疾病机制研究具有重要意义。当前主流方法主要聚焦于一维(1D)结构,强调氨基酸序列信息,但这一方法忽略了决定蛋白质功能与相互作用的关键三维(3D)结构细节。早期尝试融合1D与3D模态的方法,相较于单一模态表示,所获提升有限。在本研究中,我们提出FusionProt——一种新型的蛋白质表示学习框架,旨在同时学习蛋白质的一维序列与三维结构的统一表征。FusionProt引入了一种创新的可学习融合标记(fusion token),作为自适应桥梁,实现蛋白质语言模型与蛋白质三维结构图之间的迭代信息交互。该标记被嵌入到两种模态的训练过程中,促进信息在模态间的无缝传播,并通过多轮迭代学习机制,实现更全面、深入的表示学习。在多种生物任务上的实证评估表明,FusionProt取得了当前最优的性能表现,显著推动了蛋白质表示学习领域的发展。

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供