摘要
动机:抗体在脊椎动物的免疫系统中发挥着关键作用,同时也是科研与诊断领域的重要工具。尽管抗体中负责抗原结合的高变区(hypervariable regions)可基于其氨基酸序列轻易识别,但准确预测哪些氨基酸将与抗原直接接触(即表位结合部位,paratope)仍具挑战性。结果:本文提出一种基于序列的、概率性机器学习算法——Parapred,用于预测抗体的paratope。Parapred采用深度学习架构,综合利用局部氨基酸残基邻域信息以及整个序列的全局特征。该方法显著优于当前最先进的预测技术,且仅需输入对应高变区的一段氨基酸序列即可,无需任何关于抗原的信息。此外,我们进一步证明,利用Parapred的预测结果可有效提升刚性对接算法(rigid docking algorithm)的计算速度与预测准确性。可用性与实现:Parapred算法可通过网页服务器免费使用,网址为 http://www-mvsoftware.ch.cam.ac.uk/,也可通过 GitHub 下载:https://github.com/eliberis/parapred。联系人:[email protected] 或 [email protected]补充信息:补充材料可在 Bioinformatics 在线获取。