CompactIE: Kompakte Fakten in der Offenen Informationsgewinnung

Ein wesentlicher Nachteil moderner neuraler OpenIE-Systeme und -Benchmarks besteht darin, dass sie die hohe Abdeckung der extrahierten Informationen gegenüber der Kompaktheit ihrer Bestandteile priorisieren. Dies begrenzt die Nützlichkeit von OpenIE-Extraktionen in zahlreichen nachgelagerten Aufgaben erheblich. Die Nutzbarkeit von Extraktionen kann verbessert werden, wenn diese kompakt sind und gemeinsame Bestandteile aufweisen. Hierzu untersuchen wir das Problem der Identifizierung kompakter Extraktionen mittels neuronaler Ansätze. Wir stellen CompactIE vor, ein OpenIE-System, das einen neuartigen pipelined Ansatz verwendet, um kompakte Extraktionen mit überlappenden Bestandteilen zu erzeugen. Zunächst werden die Bestandteile der Extraktionen erkannt und anschließend miteinander verknüpft, um die Extraktionen zu bilden. Wir trainieren unser System auf kompakten Extraktionen, die durch die Verarbeitung bestehender Benchmarks gewonnen wurden. Unsere Experimente auf den Datensätzen CaRB und Wire57 zeigen, dass CompactIE 1,5- bis 2-fach mehr kompakte Extraktionen als frühere Systeme findet, wobei die Genauigkeit hoch bleibt, und somit eine neue State-of-the-Art-Leistung im Bereich OpenIE etabliert.