HyperAIHyperAI

Command Palette

Search for a command to run...

UniDrop: Eine einfache aber effektive Technik zur Verbesserung von Transformer ohne zusätzliche Kosten

Zhen Wu Lijun Wu Qi Meng Yingce Xia Shufang Xie Tao Qin Xinyu Dai Tie-Yan Liu

Zusammenfassung

Die Transformer-Architektur hat bei einer Vielzahl von Aufgaben im Bereich der natürlichen Sprachverarbeitung erheblichen Erfolg erzielt. Die starke Überparametrisierung der Transformer-Modelle hat zahlreiche Forschungsarbeiten motiviert, die Überanpassung zu reduzieren, um eine verbesserte Leistung zu erzielen. Durch einige Untersuchungen stellen wir fest, dass einfache Techniken wie Dropout bei sorgfältiger Gestaltung die Modellleistung erheblich steigern können. Daher integrieren wir in diesem Paper verschiedene Dropout-Techniken in den Trainingsprozess von Transformer-Modellen. Konkret schlagen wir einen Ansatz namens UniDrop vor, der drei unterschiedliche Dropout-Techniken von fein- bis grobgranular vereint: Feature-Dropout, Struktur-Dropout und Daten-Dropout. Theoretisch zeigen wir, dass diese drei Dropout-Techniken aus regulärisierender Sicht unterschiedliche Funktionen erfüllen. Empirisch führen wir Experimente sowohl auf Benchmark-Datensätzen für neuronale Maschinenübersetzung als auch für Text-Klassifikation durch. Umfangreiche Ergebnisse zeigen, dass Transformer-Modelle mit UniDrop eine Verbesserung um etwa 1,5 BLEU auf den IWSLT14-Übersetzungs-Aufgaben erreichen, sowie eine höhere Genauigkeit bei der Klassifikation, selbst wenn ein starkes vortrainiertes Modell wie RoBERTa als Backbone verwendet wird.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp