Command Palette
Search for a command to run...
JIZHENG LI CHANGXIN FAN Hoi Ying LAU TIANYUE WU

摘要
准确识别金属结合残基对于金属蛋白(如锌指蛋白、血红蛋白和DNA聚合酶)的研究至关重要。由于实验方法成本高且耗时,计算预测方法被广泛采用。然而,计算复杂性以及刚性框架的可扩展性差限制了其应用。本研究提出了一种两阶段、基于序列的深度学习框架,可预测蛋白质中锌、铁和镁的结合氨基酸。在第一阶段,经过分词处理的序列由独立的一维卷积神经网络(1D-CNN)处理,生成单个残基的结合概率图谱;在第二阶段,轻量级融合网络整合这些概率图谱,以建模金属间的相互依赖关系并优化预测结果。该框架采用考虑类别不平衡的损失函数,并结合集成评估策略,以提升模型的鲁棒性。其结构无关性与模块化设计使得训练和推理过程高效,因而适用于大规模蛋白质组的注释。