HyperAIHyperAI

Command Palette

Search for a command to run...

DR-BiLSTM: Abhängiges Lesen bidirektionale LSTM für natürliche Sprachinferenz

Reza Ghaeini Sadid A. Hasan Vivek Datla Joey Liu Kathy Lee Ashequl Qadir Yuan Ling Aaditya Prakash Xiaoli Z. Fern Oladimeji Farri

Zusammenfassung

Wir präsentieren eine neuartige Deep-Learning-Architektur zur Bearbeitung der Aufgabe der natürlichsprachlichen Inferenz (NLI). Bestehende Ansätze basieren in der Regel auf einfachen Lesemechanismen für die unabhängige Kodierung von Prämisse und Hypothese. Stattdessen schlagen wir ein neuartiges abhängiges Lesen mit einem bidirektionalen LSTM-Netzwerk (DR-BiLSTM) vor, um während der Kodierung und Inferenz die Beziehung zwischen einer Prämisse und einer Hypothese effizient zu modellieren. Zudem führen wir eine ausgefeilte Ensemble-Strategie ein, um unsere vorgeschlagenen Modelle zu kombinieren, was die endgültigen Vorhersagen erheblich verbessert. Schließlich zeigen wir, wie die Ergebnisse durch einen zusätzlichen Vorkodierungs-Schritt weiter optimiert werden können. Unsere Auswertung ergibt, dass das DR-BiLSTM sowohl die besten Einzelmodellergebnisse als auch die besten Ensemblemodellergebnisse erzielt und damit neue Stand-of-the-Art-Werte auf dem Stanford NLI-Datensatz erreicht.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp