Übersetzungen als zusätzliche Kontexte für die Satzklassifizierung

Bei Klassifizierungsaufgaben für Sätze können zusätzliche Kontexte, wie die benachbarten Sätze, die Genauigkeit des Klassifikators verbessern. Allerdings sind solche Kontexte domänenabhängig und können daher nicht für eine andere Klassifizierungsaufgabe mit einer unpassenden Domäne verwendet werden. Im Gegensatz dazu schlagen wir die Verwendung übersetzter Sätze als Kontext vor, der unabhängig von der Domäne immer verfügbar ist. Wir stellen fest, dass eine naive Erweiterung der Merkmale durch Übersetzungen nur marginale Verbesserungen bringt und möglicherweise die Leistung des Klassifikators verringert, da möglicherweise ungenaue Übersetzungen zu verrauschten Satzvektoren führen. Zu diesem Zweck präsentieren wir das Multiple Context Fixing Attachment (MCFA), eine Reihe von Modulen, die an mehrere Satzvektoren angehängt werden, um das Rauschen in den Vektoren unter Verwendung der anderen Satzvektoren als Kontext zu beseitigen. Wir zeigen, dass unsere Methode im Vergleich zu früheren Modellen wettbewerbsfähig ist und auf mehreren Datensätzen die beste Klassifizierungsleistung erzielt. Wir sind die ersten, die Übersetzungen als domänenfreie Kontexte für die Klassifizierung von Sätzen verwenden.