Adaptiver Hinge-Balance-Verlust für die Dokumentebene-Relationsextraktion

Document-Level-Relation-Extraktion zielt darauf ab, Beziehungen zwischen Entitäten über mehrere Sätze hinweg vorherzusagen. Eine verbreitete Vorgehensweise besteht darin, Schwellenwerte für die mehrfach-label-Klassifikation zu wählen, um zu entscheiden, ob zwischen einem Entitätenpaar eine Beziehung besteht. In der Dokument-Ebene führt jedoch die Tatsache, dass die meisten Entitätenpaare keine Beziehungen ausdrücken, zu einer starken Ungleichverteilung zwischen positiven und negativen Klassen. Wir argumentieren, dass dieses Ungleichgewicht die Schwellenwertwahl beeinflusst und zu fehlerhaften „keine-Beziehung“-Vorhersagen führen kann. In diesem Artikel schlagen wir vor, einfache negative Beispiele durch Ausnutzung des Abstands zwischen dem Klassifikationsschwellenwert und dem vorhergesagten Score jeder Beziehung zu gewichten. Unser neuartiger Adaptive Hinge Balance Loss misst die Schwierigkeit jeder Beziehungsklasse anhand dieses Abstands und legt dabei besonderen Fokus auf schwierige, falsch klassifizierte Beziehungen – also die Minderheit der positiven Beziehungen. Experimentelle Ergebnisse auf Re-DocRED zeigen die Überlegenheit unseres Ansatzes gegenüber anderen Ausgleichsverfahren. Der Quellcode ist unter https://github.com/Jize-W/HingeABL verfügbar.