HyperAIHyperAI

Command Palette

Search for a command to run...

vor 2 Monaten

LimiX: Freisetzen der Fähigkeit zur Modellierung strukturierter Daten für allgemeine Intelligenz

Xingxuan Zhang Gang Ren Han Yu Hao Yuan Hui Wang et al

LimiX: Freisetzen der Fähigkeit zur Modellierung strukturierter Daten für allgemeine Intelligenz

Abstract

Wir argumentieren, dass Fortschritte hin zu allgemeiner Intelligenz komplementäre Grundmodelle erfordern, die auf Sprache, der physischen Welt und strukturierten Daten basieren. In diesem Bericht stellen wir LimiX vor, die erste Instanz unserer großen Modelle für strukturierte Daten (Large Structured-Data Models, LDMs). LimiX behandelt strukturierte Daten als gemeinsame Verteilung über Variablen und Fehlwertstruktur und ist daher in der Lage, eine breite Palette von Tabellen-Aufgaben durch abfragbare bedingte Vorhersagen mit einem einzigen Modell zu bewältigen. LimiX wird mittels maskierter gemeinsamer Verteilungsmodellierung mit einem episodischen, kontextbedingten Zieltrainingsziel vortrainiert, wobei das Modell Vorhersagen für Abfrage-Teilmengen bedingt auf datenspezifische Kontexte trifft, was eine schnelle, trainingsschonende Anpassung zur Inference ermöglicht. Wir evaluieren LimiX anhand von 10 großen Benchmarks für strukturierte Daten, die eine breite Spanne an Stichprobengrößen, Merkmalsdimensionalitäten, Klassenanzahlen, Verhältnissen kategorischer zu numerischen Merkmalen, Fehlwertanteilen sowie Stichproben-zu-Merkmals-Verhältnissen abdecken. Mit einem einzigen Modell und einer einheitlichen Schnittstelle übertreffen LimiX konsistent starke Baselines, darunter Gradient-Boosting-Bäume, tiefe Tabellen-Netzwerke, jüngere Tabellen-Grundmodelle sowie automatisierte Ensembles, wie in Abbildung 1 und Abbildung 2 dargestellt. Die Überlegenheit zeigt sich über eine breite Aufgabenspanne – beispielsweise Klassifikation, Regression, Imputation fehlender Werte und Datengenerierung – oft mit erheblichem Abstand, ohne dass task-spezifische Architekturen oder individualisierte Trainingsprozesse pro Aufgabe erforderlich sind. Alle LimiX-Modelle sind öffentlich unter der Apache-2.0-Lizenz zugänglich.

KI mit KI entwickeln

Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.

KI-Co-Coding
Sofort einsatzbereit GPUs
Beste Preise
Jetzt starten

Hyper Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
LimiX: Freisetzen der Fähigkeit zur Modellierung strukturierter Daten für allgemeine Intelligenz | Forschungsarbeiten | HyperAI