Lernen von Rangfolgen für Frage-Antwort-Paare unter Verwendung eines hierarchischen rekurrenten Encoders mit latenter Themenclustering

In dieser Arbeit schlagen wir eine neuartige end-to-end neuronale Architektur für die Rangfolge von Kandidatenantworten vor, die eine hierarchische rekurrente Neuronale Netzstruktur und ein Modul zur latente Themenclustering anpasst. Mit unserem vorgeschlagenen Modell wird ein Text von der Wort- bis zur Chunk-Ebene in einen Vektordarstellung kodiert, um den gesamten Sinn effektiv zu erfassen. Insbesondere zeigt unser Modell durch die Anpassung der hierarchischen Struktur sehr geringe Leistungsabfälle bei der Verarbeitung längerer Texte, während andere state-of-the-art rekurrente neuronale Netzmodelle darunter leiden. Zudem extrahiert das Modul zur latente Themenclustering semantische Informationen aus den Zielbeispielen. Dieses Clustermodul ist für alle textbezogenen Aufgaben nützlich, indem es jedem Datenbeispiel ermöglicht, seinen nächsten Themencluster zu finden, was dem neuronalen Netzmodell hilft, die gesamten Daten zu analysieren. Wir evaluieren unsere Modelle am Ubuntu Dialogkorpus und an einem Frage-Antwort-Datensatz im Bereich der Konsumelektronik, der sich auf Samsung-Produkte bezieht. Das vorgeschlagene Modell erzielt state-of-the-art Ergebnisse bei der Rangfolge von Frage-Antwort-Paaren.请注意,"state-of-the-art" 在德语中通常保留为英语术语,因为它在科技和学术领域被广泛使用和理解。如果您希望将其完全翻译成德语,可以使用 "standardsicherstellend" 或 "neuester Stand der Technik"。以下是替换后的版本:In dieser Arbeit schlagen wir eine neuartige end-to-end neuronale Architektur für die Rangfolge von Kandidatenantworten vor, die eine hierarchische rekurrente Neuronale Netzstruktur und ein Modul zur latente Themenclustering anpasst. Mit unserem vorgeschlagenen Modell wird ein Text von der Wort- bis zur Chunk-Ebene in einen Vektordarstellung kodiert, um den gesamten Sinn effektiv zu erfassen. Insbesondere zeigt unser Modell durch die Anpassung der hierarchischen Struktur sehr geringe Leistungsabfälle bei der Verarbeitung längerer Texte, während andere Modelle des neuesten Standes der Technik (state-of-the-art) rekurrenter neuronaler Netze darunter leiden. Zudem extrahiert das Modul zur latente Themenclustering semantische Informationen aus den Zielbeispielen. Dieses Clustermodul ist für alle textbezogenen Aufgaben nützlich, indem es jedem Datenbeispiel ermöglicht, seinen nächsten Themencluster zu finden, was dem neuronalen Netzmodell hilft, die gesamten Daten zu analysieren. Wir evaluieren unsere Modelle am Ubuntu Dialogkorpus und an einem Frage-Antwort-Datensatz im Bereich der Konsumelektronik, der sich auf Samsung-Produkte bezieht. Das vorgeschlagene Modell erzielt Ergebnisse des neuesten Standes der Technik (state-of-the-art) bei der Rangfolge von Frage-Antwort-Paaren.