Ein Span-Level-Bidirektionales Netzwerk für die Extraktion von Aspekt-Sentiment-Tripeln

Aspect Sentiment Triplet Extraction (ASTE) ist eine neue feingranulare Aufgabe der Stimmungsanalyse, die darauf abzielt, Triplette aus Aspekttermen, Stimmungen und Meinungstermen aus Bewertungssätzen zu extrahieren. Kürzlich erzielen span-basierte Modelle durch die Nutzung aller möglichen Spannweiten ermutigende Ergebnisse bei der ASTE-Aufgabe. Da alle möglichen Spannweiten die Anzahl potentieller Aspekt- und Meinungskandidaten erheblich erhöhen, ist es sowohl entscheidend als auch herausfordernd, die Tripelteile effizient unter ihnen zu extrahieren. In dieser Arbeit stellen wir ein span-basiertes bidirektionales Netzwerk vor, das alle möglichen Spannweiten als Eingabe nutzt und Tripel bidirektional aus den Spannweiten extrahiert. Insbesondere entwickeln wir sowohl den Aspektdecoder als auch den Meinungsdecoder, um die Spanndarstellungen zu dekodieren und Tripel in Richtung Aspekt-zu-Meinung und Meinung-zu-Aspekt zu extrahieren. Durch diese beiden Decoder, die sich gegenseitig ergänzen, kann das gesamte Netzwerk die Tripel aus den Spannweiten umfassender extrahieren. Darüber hinaus berücksichtigen wir, dass zwischen den Spannweiten keine gegenseitige Ausschließbarkeit garantiert werden kann. Daher entwerfen wir einen ähnlichen Spanntrennungsverlust (span separation loss), um die nachfolgende Aufgabe des Unterscheidens der korrekten Spannweite während des Trainingsprozesses zu erleichtern; dabei wird die KL-Divergenz ähnlicher Spannweiten erweitert. Im Inferenzprozess verwenden wir eine Inferenzstrategie, um widersprüchliche Tripel auf Basis ihrer Konfidenzwerte aus den Ergebnissen zu entfernen. Experimentelle Ergebnisse zeigen, dass unser Framework nicht nur signifikant bessere Leistungen als state-of-the-art-Methoden erzielt, sondern auch eine bessere Leistung bei der Vorhersage von Tripeln mit mehreren Token und der Extraktion von Tripeln in Sätzen mit mehreren Tripeln aufweist.