Zweiseitige Mehrperspektivische Abgleichung für Natürlichsprachliche Sätze

Die natürlichsprachliche Satzübereinstimmung ist eine grundlegende Technologie für verschiedene Aufgaben. Frühere Ansätze passten entweder Sätze in einer einzigen Richtung an oder begrenzten sich auf die Anwendung von einseitiger Granularität (Wort-für-Wort- oder Satz-für-Satz-Übereinstimmung). In dieser Arbeit schlagen wir ein Modell zur bilateralen mehrperspektivischen Übereinstimmung (BiMPM) im Rahmen des "Übereinstimmungs-Aggregations"-Ansatzes vor. Gegeben seien zwei Sätze $P$ und $Q$, kodiert unser Modell diese zunächst mit einem BiLSTM-Kodierer. Anschließend passen wir die beiden kodierten Sätze in zwei Richtungen $P \rightarrow Q$ und $P \leftarrow Q$ an. In jeder Übereinstimmungsrichtung wird jeder Zeitpunkt eines Satzes aus mehreren Perspektiven mit allen Zeitpunkten des anderen Satzes verglichen. Danach wird eine weitere BiLSTM-Schicht verwendet, um die Übereinstimmungsergebnisse zu einem festen Längenvektor zusammenzufassen. Schließlich wird auf Basis des Übereinstimmungsvektors durch eine vollständig vernetzte Schicht die Entscheidung getroffen. Wir evaluieren unser Modell anhand dreier Aufgaben: Paraphrasenerkennung, natürlichsprachliche Inferenz und Auswahl der Antwortsätze. Die experimentellen Ergebnisse auf Standard-Benchmark-Datensätzen zeigen, dass unser Modell den aktuellen Stand der Technik in allen Aufgaben erreicht.