HyperAIHyperAI

Command Palette

Search for a command to run...

vor 4 Monaten

Recurrent Highway Networks mit gruppiertem Hilfsspeicher

{Wei Luo ; Feng Yu}

Abstract

Rekurrente neuronale Netze (RNNs) sind schwer zu trainieren, geschweige denn solche mit tiefen räumlichen Strukturen. Architekturen, die auf Highway-Verbindungen basieren, wie beispielsweise das Recurrent Highway Network (RHN), wurden entwickelt, um eine größere Übergangstiefe zwischen aufeinanderfolgenden Schritten zu ermöglichen und damit ausdrucksstärkere Modelle zu schaffen. Dennoch können diese Modelle weiterhin Probleme nicht effektiv lösen, die die Erfassung langfristiger Abhängigkeiten erfordern. Zudem neigt die Fähigkeit, langfristige Erinnerungen zu bewahren, dazu, mit zunehmender räumlicher Tiefe zu abzunehmen, da tiefere Strukturen das Verschwinden von Gradienten beschleunigen können. In diesem Paper lösen wir diese Probleme durch die Einführung einer neuen RNN-Architektur auf Basis des RHN, namens Recurrent Highway Network mit gruppiertem Hilfs-Speicher (GAM-RHN). Die vorgeschlagene Architektur verbindet das RHN mit einer Reihe von Hilfs-Speichereinheiten, die speziell zur Speicherung langfristiger Informationen über Lese- und Schreiboperationen dienen – ein Ansatz, der an Memory-Augmented Neural Networks (MANNs) angelehnt ist. Experimentelle Ergebnisse auf künstlichen Aufgaben mit langen zeitlichen Verzögerungen zeigen, dass GAM-RHNs effizient trainiert werden können und gleichzeitig sowohl in der Zeit als auch im Raum tief sind. Wir evaluieren die vorgeschlagene Architektur zudem auf einer Vielzahl von Aufgaben, darunter Sprachmodellierung, sequenzielle Bildklassifikation und Finanzmarktprognose. Die Leistungsfähigkeit unseres Ansatzes wird durch state-of-the-art-Ergebnisse auf diesen Aufgaben belegt.

Benchmarks

BenchmarkMethodikMetriken
language-modelling-on-penn-treebank-characterGAM-RHN-5
Bit per Character (BPC): 1.147
Number of params: 16.0M
language-modelling-on-text8GAM-RHN-10
Bit per Character (BPC): 1.157
Number of params: 44.7M
sequential-image-classification-on-sequentialGAM-RHN-1
Permuted Accuracy: 96.8%
stock-trend-prediction-on-fi-2010BL-GAM-RHN-7
Accuracy (H50): 0.8202
F1 (H50): 0.8088

KI mit KI entwickeln

Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.

KI-Co-Coding
Sofort einsatzbereit GPUs
Beste Preise
Jetzt starten

Hyper Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
Recurrent Highway Networks mit gruppiertem Hilfsspeicher | Forschungsarbeiten | HyperAI