HyperAIHyperAI
vor 2 Monaten

Universelle NER: Ein Goldstandard-Multilingualer Named Entity Recognition Benchmark

Stephen Mayhew; Terra Blevins; Shuheng Liu; Marek Šuppa; Hila Gonen; Joseph Marvin Imperial; Börje F. Karlsson; Peiqin Lin; Nikola Ljubešić; LJ Miranda; Barbara Plank; Arij Riabi; Yuval Pinter
Universelle NER: Ein Goldstandard-Multilingualer Named Entity Recognition Benchmark
Abstract

Wir stellen Universal NER (UNER) vor, ein offenes, von der Gemeinschaft getriebenes Projekt zur Entwicklung von Gold-Standard-NER-Benchmarks in vielen Sprachen. Das übergeordnete Ziel von UNER ist es, hochwertige und sprachübergreifend konsistente Annotationen bereitzustellen, um die multilingualen NER-Forschung zu fördern und zu standardisieren. UNER v1 enthält 18 Datensätze, die mit benannten Entitäten in einem sprachübergreifend konsistenten Schema für 12 verschiedene Sprachen annotiert wurden. In diesem Artikel beschreiben wir detailliert die Erstellung und Zusammensetzung der UNER-Datensätze; wir stellen außerdem erste Modellierungsbaselines sowohl für monolinguale als auch für sprachübergreifende Lernszenarien vor. Wir veröffentlichen die Daten, den Code und die angepassten Modelle öffentlich.

Universelle NER: Ein Goldstandard-Multilingualer Named Entity Recognition Benchmark | Neueste Forschungsarbeiten | HyperAI