HyperAIHyperAI

Command Palette

Search for a command to run...

Baseline-Modelle verdienen mehr Anerkennung: Über einfache word-embedding-basierte Modelle und zugehörige Pooling-Mechanismen

Dinghan Shen¹, Guoyin Wang¹, Wenlin Wang¹, Martin Renqiang Min², Qinliang Su³, Yizhe Zhang⁴, Chunyuan Li¹, Ricardo Henao¹, Lawrence Carin¹

Zusammenfassung

Viele Deep-Learning-Architekturen wurden vorgeschlagen, um die Komposition in Textsequenzen zu modellieren. Diese Architekturen erfordern eine beträchtliche Anzahl von Parametern und teure Berechnungen. Allerdings fehlt es an einer gründlichen Bewertung des zusätzlichen Nutzens komplexer kompositioneller Funktionen. In dieser Arbeit führen wir eine punktgenaue vergleichende Studie zwischen einfachen wortbasierten Modellen (Simple Word-Embedding-based Models, SWEMs), die parameterfreie Pooling-Operationen verwenden, und wortbasierten RNN/CNN-Modellen durch. Überraschenderweise zeigen SWEMs in den meisten betrachteten Fällen vergleichbare oder sogar überlegene Leistungen. Auf Basis dieses Verständnisses schlagen wir zwei zusätzliche Pooling-Strategien für gelernte Wort-Einbettungen vor: (i) eine Max-Pooling-Operation zur Verbesserung der Interpretierbarkeit; und (ii) eine hierarchische Pooling-Operation, die räumliche (n-Gramm)-Informationen innerhalb von Textsequenzen beibehält. Wir präsentieren Experimente auf 17 Datensätzen, die drei Aufgaben umfassen: (i) Dokumentklassifizierung (lange Dokumente); (ii) Textsequenz-Matching; und (iii) kurze Textaufgaben, einschließlich Klassifizierung und Tagging. Der Quellcode und die Datensätze können unter https://github.com/dinghanshen/SWEM abgerufen werden.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp