摘要
全球范围内的新冠肺炎(COVID-19)科研努力已促成数千种针对SARS-CoV-2刺突蛋白的人类抗体的分离与表征,为研究针对单一抗原的抗体应答提供了前所未有的机遇。本研究基于88篇科研论文和13项专利中的信息,整合了来自200多名供体的约8,000种针对SARS-CoV-2刺突蛋白的人类抗体数据集。通过分析免疫球蛋白V和D基因的使用情况、互补决定区H3(CDR H3)序列以及体细胞超突变特征,我们发现针对刺突蛋白不同结构域的共性(公共)抗体应答存在显著差异。此外,我们利用这些序列训练了一个深度学习模型,能够准确区分针对SARS-CoV-2刺突蛋白的人类抗体与针对流感病毒血凝素蛋白的人类抗体。总体而言,本研究构建了一个具有重要价值的抗体研究资源,深化了我们对公共抗体应答分子机制的理解。