HyperAIHyperAI

Command Palette

Search for a command to run...

Mehrskalige Rekurrente Neuronale Netze: Eine Anwendung zur Generierung von Dialogantworten

Iulian Vlad Serban Tim Klinger Gerald Tesauro Kartik Talamadupula Bowen Zhou Yoshua Bengio Aaron Courville

Zusammenfassung

Wir stellen das mehrschichtige rekurrente Neuronale Netzwerk (Multiresolution Recurrent Neural Network) vor, das den sequenz-basierten Ansatz erweitert, um die natürliche Sprachgenerierung als zwei parallele diskrete stochastische Prozesse zu modellieren: eine Sequenz von hochstufigen groben Token und eine Sequenz von natürlichen Sprachtokens. Es gibt viele Möglichkeiten, die hochstufigen groben Token zu schätzen oder zu lernen, aber wir argumentieren, dass ein einfaches Extraktionsverfahren ausreichend ist, um eine Fülle von hochstufigen Diskurssemantiken zu erfassen. Dieses Verfahren ermöglicht es, das mehrschichtige rekurrente Neuronale Netzwerk durch die Maximierung der exakten gemeinsamen Log-Likelihood über beide Sequenzen zu trainieren. Im Gegensatz zum standardmäßigen Log-Likelihood-Ziel in Bezug auf natürliche Sprachtokens (Wortperplexität) führt die Optimierung der gemeinsamen Log-Likelihood dazu, dass das Modell eher hochstufige Abstraktionen modelliert. Wir wenden das vorgeschlagene Modell auf die Aufgabe der Dialogantwortgenerierung in zwei anspruchsvollen Domänen an: dem Bereich technischer Unterstützung für Ubuntu und Twitter-Gesprächen. Bei Ubuntu übertreffen die Ergebnisse des Modells die konkurrierenden Ansätze deutlich und erreichen nach automatischen Evaluationsmetriken sowie einer menschlichen Bewertungsstudie den aktuellen Stand der Technik. Bei Twitter erzeugt das Modell laut automatischen Evaluationsmetriken offensichtlich relevantere und thematisch angemessenere Antworten. Schließlich zeigen unsere Experimente, dass das vorgeschlagene Modell besser in der Lage ist, die Sparsamkeit der natürlichen Sprache zu überwinden und langfristige Strukturen besser zu erfassen.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp