1 个月前

具体自动编码器用于可微特征选择和重构

Abubakar Abid; Muhammad Fatih Balin; James Zou
具体自动编码器用于可微特征选择和重构
摘要

我们介绍了一种具体的自动编码器(concrete autoencoder),这是一种端到端可微分的全局特征选择方法,能够高效地识别出最具信息量的特征子集,并同时学习一个神经网络以从选定的特征中重建输入数据。我们的方法是无监督的,基于使用具体选择层(concrete selector layer)作为编码器,并使用标准神经网络作为解码器。在训练阶段,具体选择层的温度逐渐降低,这促使模型学习用户指定数量的离散特征。在测试阶段,选定的特征可以与解码器网络结合使用,以重建其余的输入特征。我们在多种数据集上评估了具体的自动编码器,结果表明其在特征选择和数据重建方面显著优于现有最先进的方法。特别是在一个大规模基因表达数据集中,具体的自动编码器选择了少数几个基因,这些基因的表达水平可用于推断其余基因的表达水平。通过这种方式,它改进了目前广泛使用的L1000标志基因(landmark genes),有望将测量成本降低20%。具体的自动编码器可以通过在标准自动编码器的基础上添加几行代码来实现。

具体自动编码器用于可微特征选择和重构 | 最新论文 | HyperAI超神经