Offene Informationsextraktion aus konjunktiven Sätzen

Wir entwickeln CALM, einen Koordinationsanalysewerkzeug, der die aus Dependency-Parsen abgeleiteten Konjunkte verbessert. Er nutzt eine auf Sprachmodellen basierende Bewertung sowie mehrere sprachliche Einschränkungen, um über hierarchische Konjunktionsgrenzen (für geschachtelte Koordination) zu suchen. Durch Aufspalten eines konjunktiven Satzes entlang dieser Konjunkte erzeugt CALM mehrere einfache Sätze. Wir zeigen den Nutzen unseres Koordinationsanalysewerkzeugs im Endzweck der Open Information Extraction (Open IE). Moderne Open-IE-Systeme verlieren erhebliche Ausbeute aufgrund ineffektiver Behandlung konjunktiver Sätze. Unser Open-IE-System, CALMIE, führt die Extraktion über die von CALM identifizierten einfachen Sätze durch und erreicht dabei bis zu 1,8-fache Ausbeute im Vergleich zu Extraktionen aus ursprünglichen Sätzen, wobei die Genauigkeit nur moderat sinkt.