HyperAIHyperAI

Command Palette

Search for a command to run...

Schnelle und einfache Mischung von Softmax-Funktionen mit BPE und Hybrid-LightRNN für Sprachgenerierung

Xiang Kong; Qizhe Xie; Zihang Dai; Eduard Hovy

Zusammenfassung

Die Mischung von Softmax-Funktionen (MoS) hat sich als effektiv erwiesen, um die Ausdrucksbeschränkungen von Softmax-basierten Modellen zu überwinden. Trotz des bekannten Vorteils wird die praktische Anwendung von MoS durch den hohen Speicher- und Rechenzeitaufwand eingeschränkt, der auf die Notwendigkeit zurückzuführen ist, mehrere Softmax-Funktionen zu berechnen. In dieser Arbeit untersuchen wir verbesserte Wortcodierungsschemata, die effektiv das Wörterbuchvolumen reduzieren und somit den Speicher- und Rechenaufwand verringern können. Wir zeigen, dass sowohl BPE als auch unser vorgeschlagenes Hybrid-LightRNN zu verbesserten Codierungsmechanismen führen, die den Zeit- und Speicherverbrauch von MoS um die Hälfte reduzieren können, ohne Leistungsverluste. Mit MoS erreichen wir eine Verbesserung um 1,5 BLEU-Punkte im IWSLT 2014 Deutsch-Englisch-Korpus und eine Steigerung um 0,76 CIDEr-Punkte bei Bildunterschriften. Darüber hinaus erzielt unser mit MoS verstärkter Transformer auf dem größeren WMT 2014-Maschinelle Übersetzung-Datensatz 29,5 BLEU-Punkte für Englisch-Deutsch und 42,1 BLEU-Punkte für Englisch-Französisch. Dies übertreffen die Ergebnisse des Single-Softmax-Transformers jeweils um 0,8 und 0,4 BLEU-Punkte und stellen den aktuellen Stand der Technik im WMT 2014 Englisch-Deutsch-Auftrag dar.请注意,这里的“WMT”和“IWSLT”是国际知名的机器翻译评测活动的缩写,通常在德语文献中也会直接使用这些英文缩写。此外,“BLEU”和“CIDEr”是评估机器翻译质量和图像描述生成质量的常用指标,同样会在德语文献中直接使用英文表述。


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
Schnelle und einfache Mischung von Softmax-Funktionen mit BPE und Hybrid-LightRNN für Sprachgenerierung | Paper | HyperAI