HyperAIHyperAI
il y a 11 jours

Simple mais Puissant : Une Architecture Méconnue pour la Reconnaissance de Noms Intégrés

{Jocelyn Dunstan, Felipe Bravo-Marquez, Matias Rojas}
Simple mais Puissant : Une Architecture Méconnue pour la Reconnaissance de Noms Intégrés
Résumé

La reconnaissance d'entités nommées (NER) est une tâche fondamentale en traitement du langage naturel dont l'objectif est d'identifier des segments de texte appartenant à des catégories prédéfinies. Les systèmes traditionnels de NER ignorent les entités imbriquées, c’est-à-dire des entités incluses dans d’autres mentions d’entités. Bien que plusieurs méthodes aient été proposées pour traiter ce cas, la plupart reposent sur des architectures spécifiques à la tâche complexes et négligent des références baselines potentiellement utiles. Nous soutenons que cela donne une impression trop optimiste de leurs performances. Ce papier réexamine le modèle Multiple LSTM-CRF (MLC), une approche simple, peu connue mais puissante, fondée sur l’entraînement de modèles indépendants de labellisation de séquences pour chaque type d’entité. Des expériences étendues menées sur trois corpus de NER imbriqué montrent que, malgré sa simplicité, ce modèle atteint des performances supérieures ou au moins équivalentes à celles des méthodes plus sophistiquées. En outre, nous démontrons que l’architecture MLC obtient des résultats de pointe sur le corpus de la liste d’attente chilienne en intégrant des modèles de langage préentraînés. Par ailleurs, nous avons développé une bibliothèque open source permettant de calculer des métriques spécifiques à la tâche pour la NER imbriquée. Les résultats suggèrent que les métriques utilisées dans les travaux antérieurs ne mesurent pas efficacement la capacité d’un modèle à détecter des entités imbriquées, tandis que nos métriques fournissent de nouvelles preuves sur la manière dont les approches existantes abordent cette tâche.

Simple mais Puissant : Une Architecture Méconnue pour la Reconnaissance de Noms Intégrés | Articles de recherche récents | HyperAI