本研究では、2種類の異なる手法で事前学習された大型言語モデル「ChemBERTa-2」のバージョンを用い、HIV複製阻害の予測に対して微調整を行った。最良のモデルはAUROC 0.793を達成した。微調整前の分子埋め込みの分布と微調整後の分布の変化から、モデルが活性と非活性のHIV分子をより明確に区別する能力が向上したことが示された。