vor 6 Monaten

Zusammenfassung

Intrinsische Evaluierungen von Open Information Extraction (OIE)-Systemen werden entweder manuell durchgeführt – wobei menschliche Beurteiler die Korrektheit der Extraktionen bewerten – oder automatisch anhand standardisierter Benchmarks. Letztere sind zwar deutlich kosteneffizienter, jedoch weniger zuverlässig, hauptsächlich aufgrund der Unvollständigkeit bestehender OIE-Benchmarks: Die Ground-Truth-Extraktionen enthalten nicht alle akzeptablen Varianten desselben Fakts, was zu einer unzuverlässigen Beurteilung der Modellleistung führt. Zudem sind die derzeit verfügbaren OIE-Benchmarks ausschließlich für Englisch verfügbar. In dieser Arbeit stellen wir BenchIE vor: ein Benchmark- und Evaluierungsframework zur umfassenden Bewertung von OIE-Systemen für Englisch, Chinesisch und Deutsch. Im Gegensatz zu bestehenden OIE-Benchmarks basiert BenchIE auf Fakten, d. h., es berücksichtigt die informationsäquivalente Natur von Extraktionen: Unser Gold-Standard besteht aus Faktensynsets, also Clustern, in denen alle akzeptablen Oberflächenformen desselben Fakts erschöpfend aufgelistet sind. Zudem berücksichtigen wir häufige Anwendungen von OIE in nachgeschalteten Prozessen und gestalten BenchIE facettenreich; d. h., wir erstellen Benchmark-Varianten, die sich auf verschiedene Aspekte der OIE-Evaluation konzentrieren, beispielsweise auf Kompaktheit oder Minimalkriterien von Extraktionen. Wir bewerten mehrere state-of-the-art-OIE-Systeme mit Hilfe von BenchIE und zeigen, dass diese Systeme signifikant weniger effektiv sind, als es bisherige OIE-Benchmarks nahelegen. BenchIE (Daten und Evaluierungscode) stellen wir öffentlich auf https://github.com/gkiril/benchie zur Verfügung.

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

vor 6 Monaten

Benchmarks

Datensatz

Natürliche Sprachverarbeitung

KI-Infrastruktur

Natürliche Sprachverarbeitung

Aufgabe

Kiril Gashteovski Mingying Yu Bhushan Kotnis Carolin Lawrence Mathias Niepert Goran Glavaš

Zusammenfassung

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

vor 6 Monaten

Benchmarks

Datensatz

Natürliche Sprachverarbeitung

KI-Infrastruktur

Natürliche Sprachverarbeitung

Aufgabe

Kiril Gashteovski Mingying Yu Bhushan Kotnis Carolin Lawrence Mathias Niepert Goran Glavaš

Zusammenfassung

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

Command Palette

BenchIE: Ein Framework zur mehrfachen, faktengestützten Evaluation der offenen Informationsgewinnung

Kiril Gashteovski Mingying Yu Bhushan Kotnis Carolin Lawrence Mathias Niepert Goran Glavaš

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

BenchIE: Ein Framework zur mehrfachen, faktengestützten Evaluation der offenen Informationsgewinnung

Kiril Gashteovski Mingying Yu Bhushan Kotnis Carolin Lawrence Mathias Niepert Goran Glavaš

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

BenchIE: Ein Framework zur mehrfachen, faktengestützten Evaluation der offenen Informationsgewinnung

Kiril Gashteovski Mingying Yu Bhushan Kotnis Carolin Lawrence Mathias Niepert Goran Glavaš

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters