Diskursmarker erweitertes Netzwerk mit Verstärkungslernen für die natürlichsprachliche Inferenz

Die Natürliche Sprachinferenz (NLI), auch bekannt als Textuelle Implikationserkennung (RTE), ist eines der wichtigsten Probleme im Bereich der natürlichen Sprachverarbeitung. Sie erfordert die Ableitung der logischen Beziehung zwischen zwei gegebenen Sätzen. Während aktuelle Ansätze sich hauptsächlich auf die Interaktionsarchitekturen der Sätze konzentrieren, schlagen wir in diesem Papier vor, Wissen von wichtigen Diskursmarkern zu übertragen, um die Qualität des NLI-Modells zu verbessern. Wir beobachten, dass Menschen üblicherweise bestimmte Diskursmarker wie "so" oder "aber" verwenden, um die logische Beziehung zwischen zwei Sätzen darzustellen. Diese Wörter haben potentiell tiefgreifende Verbindungen mit den Bedeutungen der Sätze und können daher genutzt werden, um deren Darstellungen zu verbessern. Des Weiteren nutzen wir das Reinforcement Learning, um eine neue Zielfunktion zu optimieren, wobei die Belohnung durch die Eigenschaften der NLI-Datensätze definiert wird, um die Labelinformationen optimal auszuwerten. Experimente zeigen, dass unsere Methode auf mehreren großen Datensätzen den aktuellen Stand der Technik erreicht.