
摘要
随着数据维度的增加,特征提取变得越来越重要。基于神经网络的自编码器作为一种特征提取方法,在生成高维数据的抽象特征方面取得了显著成功。然而,它未能考虑数据样本之间的关系,这可能会影响使用原始特征和新特征进行实验的结果。在本文中,我们提出了一种同时考虑数据特征及其关系的关系自编码器模型(Relation Autoencoder)。此外,我们将该模型扩展到与其他主要自编码器模型的结合使用,包括稀疏自编码器(Sparse Autoencoder)、去噪自编码器(Denoising Autoencoder)和变分自编码器(Variational Autoencoder)。所提出的关系自编码器模型在一组基准数据集上进行了评估,实验结果表明,考虑数据关系可以生成更加鲁棒的特征,这些特征在进一步分类中的构造损失更低,从而降低了错误率,相较于其他自编码器变体表现更优。