HyperAIHyperAI

Command Palette

Search for a command to run...

Zum Stand der Kunst der Bewertung in neuronalen Sprachmodellen

Gábor Melis; Chris Dyer; Phil Blunsom

Zusammenfassung

Fortlaufende Innovationen in den Architekturen von rekurrenten Neuronalen Netzen haben eine stetige Flut scheinbarer Spitzenleistungen bei Benchmarks für Sprachmodelle zur Folge gehabt. Diese wurden jedoch unter Verwendung unterschiedlicher Codebasen und begrenzter Rechenressourcen evaluiert, was unbeobachtete Quellen experimenteller Variation darstellt. Wir bewerten mehrere gängige Architekturen und Regularisierungsmethoden mit groß angelegtem automatischem Black-Box-Hyperparameter-Tuning neu und gelangen zu dem überraschenden Schluss, dass standardisierte LSTM-Architekturen, wenn sie angemessen regularisiert werden, neueren Modellen überlegen sind. Wir etablieren einen neuen Stand der Technik auf den Korpora des Penn Treebank und Wikitext-2 sowie starke Baseline-Modelle auf dem Datensatz des Hutter Prize (Hutter Preis).


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp