7 天前
Hopular:面向表格数据的现代霍普菲尔德网络
Bernhard Schäfl, Lukas Gruber, Angela Bitto-Nemling, Sepp Hochreiter

摘要
尽管深度学习在视觉和自然语言处理等结构化数据任务中表现出色,但在表格数据(tabular data)上的表现却未能达到预期。对于表格数据,支持向量机(SVM)、随机森林(Random Forests)以及梯度提升(Gradient Boosting)是性能最优的技术,其中梯度提升位居前列。近年来,针对表格数据设计的深度学习方法不断涌现,但在小规模数据集上仍难以超越梯度提升算法的性能。为此,我们提出了一种名为“Hopular”的新型深度学习架构,专为中等及小规模数据集设计。该架构的每一层均配备了连续型现代霍普菲尔德网络(continuous modern Hopfield networks)。这些现代霍普菲尔德网络能够利用存储的数据,识别特征-特征、特征-目标以及样本-样本之间的依赖关系。Hopular的创新之处在于:每一层均可通过霍普菲尔德网络中存储的信息,直接访问原始输入以及整个训练集。因此,Hopular能够在每一层中像标准的迭代学习算法一样,逐步更新当前模型及其预测结果。在包含少于1,000个样本的小规模表格数据集上的实验表明,Hopular在性能上超越了梯度提升、随机森林、支持向量机,以及多种现有的深度学习方法。在中等规模表格数据集(约10,000个样本)上的实验进一步显示,Hopular在性能上优于XGBoost、CatBoost、LightGBM,以及一种针对表格数据设计的先进深度学习方法。因此,Hopular为表格数据建模提供了一种极具竞争力的替代方案,展现出在中、小规模数据场景下的显著优势。