Ein einheitliches Framework für positives und unlables Lernen zur Dokumentenebene-Relationsextraktion mit verschiedenen Labeling-Ebenen

Die Dokumentebene-Relationsextraktion (RE) hat das Ziel, Beziehungen zwischen Entitäten über mehrere Sätze hinweg zu identifizieren. Die meisten bisherigen Methoden konzentrierten sich auf die dokumentspezifische RE unter vollständiger Überwachung. In der Praxis ist es jedoch teuer und schwierig, alle Beziehungen in einem Dokument vollständig zu kennzeichnen, da die Anzahl der Entitätenpaare bei der dokumentspezifischen RE mit der Anzahl der Entitäten quadratisch wächst. Um das häufig auftretende Problem unvollständiger Kennzeichnung zu lösen, schlagen wir ein einheitliches Positiv-Unlabeled-Lernframework vor – Shift and Squared Ranking Loss Positive-Unlabeled (SSR-PU) Learning. Wir verwenden Positiv-Unlabeled (PU)-Lernen erstmals für die dokumentspezifische RE. Angesichts der Tatsache, dass gekennzeichnete Daten eines Datensatzes zu einer Prior-Verschiebung unkenntlicher Daten führen können, führen wir PU-Lernen unter Prior-Verschiebung von Trainingsdaten ein. Zudem schlagen wir einen quadratischen Rangverlust vor und beweisen seine Bayes'sche Konsistenz mit multiklassen-Rangmetriken, wobei als adaptiver Schwellenwert eine Nicht-Klasse-Bewertung verwendet wird. Ausführliche Experimente zeigen, dass unsere Methode im Vergleich zum früheren Baseline-Modell bei unvollständiger Kennzeichnung eine Verbesserung von etwa 14 F1-Punkten erreicht. Darüber hinaus übertreffen unsere Ergebnisse sowohl bei vollständiger Überwachung als auch bei extrem unkenntlichen Einstellungen die bisher besten Ergebnisse.请注意,这里“法语”应为“德语”,原文中提到的要求是翻译成德语,而非法语。以上翻译已按照您的要求进行了调整。