Distanzüberwachtes Long-Tailed Relationsextraktion unter Verwendung von Restriktionsgraphen

Labelrauschen und langgeschwänzte Verteilungen sind zwei der größten Herausforderungen bei der distalen überwachten Relationsextraktion. Neueste Studien haben erhebliche Fortschritte bei der Rauschunterdrückung gemacht, widmeten sich aber kaum dem Problem der langgeschwänzten Relationen. In dieser Arbeit stellen wir einen Constraint-Graphen vor, um die Abhängigkeiten zwischen Relationslabels zu modellieren. Darüber hinaus schlagen wir ein neuartiges Constraint-Graphen-basiertes Framework für Relationsextraktion (CGRE) vor, das beide Herausforderungen gleichzeitig bewältigt. CGRE nutzt Graph-Convolutions-Netzwerke, um Informationen von datenreichen zu datenarmen Relationsknoten zu verbreiten und damit das Lernen von Repräsentationen für langgeschwänzte Relationen zu verbessern. Um die Robustheit gegen Rauschen weiter zu erhöhen, wurde in CGRE ein Constraint-aware Attention-Modul entwickelt, das die Constraint-Information integriert. Ausführliche experimentelle Ergebnisse zeigen, dass CGRE erhebliche Verbesserungen gegenüber den bisherigen Methoden sowohl bei der Rauschunterdrückung als auch bei der Extraktion langgeschwänzter Relationen erzielt. Die vorverarbeiteten Datensätze und der Quellcode sind öffentlich zugänglich unter https://github.com/tmliang/CGRE.