HyperAIHyperAI
vor 11 Tagen

TIMEN: Eine offene Ressource zur Normalisierung zeitlicher Ausdrücke

{Robert Gaizauskas, Leon Derczynski, Hector Llorens, Estela Saquete}
Abstract

Zeitliche Ausdrücke sind Wörter oder Ausdrücke, die einen Zeitpunkt, eine Dauer oder eine Wiederholung im Zeitverlauf beschreiben. Die automatische Annotation solcher Ausdrücke ist ein zunehmend relevantes Forschungsfeld. Ihre Erkennung lässt sich mit minimal supervisiertem maschinellen Lernen erreichen, doch deren genaue Interpretation (Normalisierung) ist eine komplexe Aufgabe, die menschliches Wissen erfordert. In diesem Artikel stellen wir TIMEN vor, ein communitygetriebenes Werkzeug zur Normalisierung zeitlicher Ausdrücke. TIMEN basiert auf den aktuellen besten Ansätzen und ist ein eigenständiges Tool, das sich leicht in bestehende Systeme integrieren lässt. Wir argumentieren, dass die Normalisierung zeitlicher Ausdrücke nur effektiv mit einem umfangreichen Wissensbestand und einer Vielzahl von Regeln durchgeführt werden kann. Unsere Lösung ist ein Framework und System, das dazu dient, dieses Wissen für verschiedene Sprachen zu erfassen. Anhand sowohl bestehender als auch neu annotierter Daten präsentieren wir Ergebnisse mit wettbewerbsfähiger Leistung und laden die Gemeinschaft des Informationsextraktion (IE) ein, zur Entwicklung eines gemeinsamen Wissensbestands beizutragen, um das Problem der Normalisierung zeitlicher Ausdrücke zu lösen.

TIMEN: Eine offene Ressource zur Normalisierung zeitlicher Ausdrücke | Neueste Forschungsarbeiten | HyperAI