Command Palette

Search for a command to run...

2 个月前

epiGPTope:一种基于机器学习的表位生成与分类工具

Natalia Flechas Manrique Alberto Martínez Elena López-Martínez Luc Andrea Román Orus et al

epiGPTope:一种基于机器学习的表位生成与分类工具

摘要

表位是抗原性短肽序列,可被抗体或免疫细胞受体识别,是免疫疗法、疫苗及诊断技术开发的核心要素。然而,由于线性表位的氨基酸序列组合空间巨大(n个氨基酸的组合数为庞大的组合数),即使采用高通量实验技术,对合成表位文库进行筛选和测试也变得不可行,因此理性设计合成表位文库极具挑战性。本研究提出一种大型语言模型——epiGPTope,该模型在蛋白质数据上进行预训练,并针对线性表位进行了专门微调,首次实现了直接生成具有新表位样特征的肽序列。这些生成的序列在统计特性上与已知表位高度相似。该生成式方法可用于构建表位候选序列文库。此外,我们进一步训练了统计分类模型,以预测某一表位序列源自细菌还是病毒,从而有效缩小候选文库范围,提高识别特异性表位的可能性。我们提出,生成模型与预测模型的结合可为表位发现提供有力支持。该方法仅依赖线性表位的一级氨基酸序列,无需几何结构框架或人工设计的序列特征。通过开发一种生成生物学上可行序列的方法,我们有望实现合成表位的更快速、低成本生成与筛选,为新型生物技术的研发提供重要应用前景。

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供