HyperAIHyperAI

Command Palette

Search for a command to run...

ANTILLES: Ein offenes französisches, sprachlich angereichertes Korpus zur Wortartenannotation

Richard Dufour Yanis Labrak

Zusammenfassung

Part-of-Speech-(POS)-Tagging ist eine klassische Aufgabe im Bereich des Natural Language Processing (NLP). Obwohl zahlreiche Tools und Korpora, insbesondere für die am häufigsten gesprochenen Sprachen, vorgeschlagen wurden, leiden diese oft unter Einschränkungen hinsichtlich ihrer Lizenzbedingungen, der Größe ihres Tagsets oder sogar veralteten Ansätzen, die nicht mehr dem Stand der Technik entsprechen. In diesem Artikel stellen wir ANTILLES vor, eine erweiterte Version eines bestehenden französischen Korpus (UD French-GSD), die eine originelle Menge von Tags enthält, die mithilfe morphologischer Merkmale (Geschlecht, Numerus, Tempus usw.) ermittelt wurden. Diese erweiterte Version umfasst 65 Tags im Gegensatz zu den 16 Tags in der ursprünglichen Version. Zudem haben wir mehrere POS-Tools für Französisch auf Basis dieses Korpus implementiert, wobei wir die neuesten Fortschritte des Standes der Technik in diesem Bereich integriert haben. Das Korpus sowie die POS-Tagging-Tools sind vollständig offen und frei zugänglich.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
ANTILLES: Ein offenes französisches, sprachlich angereichertes Korpus zur Wortartenannotation | Paper | HyperAI