HyperAIHyperAI
vor 2 Monaten

Ein Paralleler-Hierarchischer Modell für die Maschinelle Verarbeitung von Text bei dünn besiedelten Daten

Adam Trischler; Zheng Ye; Xingdi Yuan; Jing He; Phillip Bachman; Kaheer Suleman
Ein Paralleler-Hierarchischer Modell für die Maschinelle Verarbeitung von Text bei dünn besiedelten Daten
Abstract

Das Verstehen von unstrukturiertem Text ist ein wichtiges Ziel im Bereich der natürlichen Sprachverarbeitung. Verständnistests stellen Fragen auf Grundlage kurzer Textabschnitte, um dieses Verständnis zu bewerten. In dieser Arbeit untersuchen wir die maschinelle Verständigung am anspruchsvollen Benchmark {\it MCTest}. Aufgrund seiner begrenzten Größe hat frühere Forschung zum {\it MCTest} sich hauptsächlich auf die Entwicklung besserer Merkmale konzentriert. Wir greifen den Datensatz mit einem neuronalen Ansatz an und nutzen einfache neuronale Netze, die in einer parallelen Hierarchie angeordnet sind. Die parallele Hierarchie ermöglicht es unserem Modell, den Textabschnitt, die Frage und die Antwort aus verschiedenen trainierbaren Perspektiven zu vergleichen, anstatt eine manuell entworfene, starre Merkmalsmenge zu verwenden. Die Perspektiven reichen vom Wortniveau über Satzfragmente bis hin zu Sequenzen von Sätzen; die Netze arbeiten ausschließlich mit Wort-Einbettungsrepräsentationen des Textes. Wenn das Modell mit einer Methode trainiert wird, die darauf abzielt, mit begrenzten Trainingsdaten umzugehen, erreicht unser Parallel-Hierarchisches Modell einen neuen Stand der Technik für {\it MCTest}, indem es leicht bessere Ergebnisse als frühere Merkmalsingenierte Ansätze und deutlich bessere Ergebnisse als frühere neurale Ansätze erzielt (über 15\% absolut).

Ein Paralleler-Hierarchischer Modell für die Maschinelle Verarbeitung von Text bei dünn besiedelten Daten | Neueste Forschungsarbeiten | HyperAI