在实验过程中,由于化合物生物活性较低而导致药物失败,已成为一项重大挑战。为降低此类风险并提升化合物的生物活性,于先导化合物优化阶段预测其生物活性类别至关重要。现有结构-活性关系(Structure–Activity Relationship, SAR)研究已揭示化合物化学结构与其生物活性之间的关联,但这些研究往往忽视了药物与生物活性之间复杂的多维关系,而该关系不仅涉及化学结构,还受到多种其他因素的影响。为解决这一问题,本文提出一种名为BioAct-Het的新型模型,采用异质孪生神经网络(heterogeneous siamese neural network)对药物与生物活性类别之间的复杂关系进行建模,并将其映射至统一的潜在空间中。特别地,我们引入了一种全新的生物活性类别表征方法,称为Bio-Prof,并对原始生物活性数据集进行了增强,以缓解数据稀缺问题。上述创新性策略使本模型在性能上显著优于现有方法。为全面评估BioAct-Het模型的有效性,本文采用三种不同的评估策略:基于关联性的策略、基于生物活性类别的策略以及基于化合物的策略。其中,基于关联性的策略采用监督学习分类方法;基于生物活性类别的策略则采用回顾性研究评估范式;而基于化合物的策略则在思想上与元学习(meta-learning)概念相似。此外,通过一项实际案例研究,进一步分析了该模型在解决现实问题中的有效性,具体包括:评估万古霉素(vancomycin)与奥司他韦(oseltamivir)用于治疗新冠肺炎(COVID-19)的潜力,以及莫诺拉韦(molnupiravir)在治疗COVID-19患者中的潜在疗效。本文所使用的数据与代码已公开,可于 https://github.com/CBRC-lab/BioAct-Het 获取。需说明的是,所有数据集均来源于公开数据源。