
摘要
尽管图像和文本在机器学习中广泛应用,表格数据仍在多个领域中持续发挥重要作用。现有的深度学习模型(如卷积神经网络和Transformer)虽然表现优异,但通常需要复杂的预处理和参数调优,限制了其可访问性与可扩展性。本文提出一种创新方法——基于结构化状态空间模型(Structured State-Space Model, SSM)的MambaTab,用于表格数据的建模。SSM具备高效捕捉长程依赖关系的能力,而MambaTab则利用新兴的SSM变体Mamba,实现对表格数据的端到端监督学习。在多个基准数据集上的实证结果表明,MambaTab在性能上超越当前最先进基线模型,同时显著减少参数量。MambaTab在效率、可扩展性、泛化能力及预测性能方面的综合优势,使其成为一种轻量级、即插即用(plug-and-play)的表格数据处理方案,具有广阔的实际应用前景。