
摘要
针对生物信号(如脑电图 EEG 和心电图 ECG)的数据集,通常存在标签噪声严重且受试者数量有限(少于100人)的问题。为应对这些挑战,我们提出一种基于对比学习的自监督方法,旨在减少对标注数据的依赖,并在受试者数量较少的情况下实现有效建模。在标签和受试者均受限的场景下,个体间差异性会显著影响模型性能。为此,我们引入了面向受试者的学习机制,具体包括:(1)基于个体特异性的对比损失函数,以及(2)通过对抗训练促进自监督学习过程中的受试者不变性。此外,我们还设计了一系列适用于时间序列数据的增强技术,与对比损失结合,用于提升生物信号的建模效果。所提出的方法在两个不同生物信号的公开数据集上进行了评估,涵盖两类任务:EEG 解码与 ECG 异常检测。实验结果表明,通过自监督学习获得的嵌入表示在分类性能上可与完全监督的方法相媲美。我们进一步验证了受试者不变性有助于提升特征表示的质量,同时在使用监督标签进行微调时,个体特异性损失能够显著提升模型性能。