MambaTab: Ein Plug-and-Play-Modell zum Lernen von Tabulardaten

Trotz der hohen Verbreitung von Bildern und Texten in der maschinellen Lernens bleibt tabellarische Daten in vielen Bereichen weit verbreitet. Bestehende tiefgehende Lernmodelle wie Faltungsneuronale Netze und Transformers erzielen zwar gute Leistungen, erfordern jedoch umfangreiche Vorverarbeitung und Feinabstimmung, was ihre Zugänglichkeit und Skalierbarkeit einschränkt. In dieser Arbeit wird ein innovativer Ansatz vorgestellt, der auf einem strukturierten Zustandsraummodell (Structured State-Space Model, SSM) basiert und als MambaTab für tabellarische Daten konzipiert ist. SSMs verfügen über starke Fähigkeiten, effektive Repräsentationen aus Daten mit langen Abhängigkeiten effizient zu extrahieren. MambaTab nutzt Mamba, eine neuere Variante des SSMs, für eine end-to-end überwachte Lernaufgabe auf Tabellen. Im Vergleich zu aktuellen Spitzenmodellen erzielt MambaTab eine überlegene Leistung bei erheblich geringerem Parameteraufwand, wie empirisch an diversen Benchmark-Datensätzen bestätigt wurde. Die Effizienz, Skalierbarkeit, Allgemeingültigkeit und prädiktiven Verbesserungen von MambaTab machen es zu einer leichten, „plug-and-play“-Lösung für vielfältige tabellarische Daten mit großem Potenzial für eine breitere praktische Anwendung.