il y a 17 jours
Reconnaissance d'entités nommées dans le domaine juridique roumain
{Alexandru Ianov, Vlad Coneschi, Carol Luca Gasan, Maria Mitrofan, Vasile Pais}

Résumé
La reconnaissance des entités nommées présentes dans un texte constitue une étape essentielle pour l'extraction d'informations et la compréhension du langage naturel. Ce travail présente un système de reconnaissance d'entités nommées dédié au domaine juridique roumain. Le système s'appuie sur le corpus annoté de référence LegalNERo. De plus, il combine plusieurs représentations distributionnelles des mots, notamment des embeddings de mots entraînés sur un grand corpus spécialisé dans le domaine juridique. Toutes les ressources, y compris le corpus, le modèle et les embeddings de mots, sont mises à disposition sous licence open source. Enfin, le meilleur système est directement accessible via la plateforme RELATE.