HyperAIHyperAI

Command Palette

Search for a command to run...

il y a 4 mois

Simple mais Puissant : Une Architecture Méconnue pour la Reconnaissance de Noms Intégrés

{Jocelyn Dunstan Felipe Bravo-Marquez Matias Rojas}

Simple mais Puissant : Une Architecture Méconnue pour la Reconnaissance de Noms Intégrés

Résumé

La reconnaissance d'entités nommées (NER) est une tâche fondamentale en traitement du langage naturel dont l'objectif est d'identifier des segments de texte appartenant à des catégories prédéfinies. Les systèmes traditionnels de NER ignorent les entités imbriquées, c’est-à-dire des entités incluses dans d’autres mentions d’entités. Bien que plusieurs méthodes aient été proposées pour traiter ce cas, la plupart reposent sur des architectures spécifiques à la tâche complexes et négligent des références baselines potentiellement utiles. Nous soutenons que cela donne une impression trop optimiste de leurs performances. Ce papier réexamine le modèle Multiple LSTM-CRF (MLC), une approche simple, peu connue mais puissante, fondée sur l’entraînement de modèles indépendants de labellisation de séquences pour chaque type d’entité. Des expériences étendues menées sur trois corpus de NER imbriqué montrent que, malgré sa simplicité, ce modèle atteint des performances supérieures ou au moins équivalentes à celles des méthodes plus sophistiquées. En outre, nous démontrons que l’architecture MLC obtient des résultats de pointe sur le corpus de la liste d’attente chilienne en intégrant des modèles de langage préentraînés. Par ailleurs, nous avons développé une bibliothèque open source permettant de calculer des métriques spécifiques à la tâche pour la NER imbriquée. Les résultats suggèrent que les métriques utilisées dans les travaux antérieurs ne mesurent pas efficacement la capacité d’un modèle à détecter des entités imbriquées, tandis que nos métriques fournissent de nouvelles preuves sur la manière dont les approches existantes abordent cette tâche.

Benchmarks

BenchmarkMéthodologieMétriques
nested-named-entity-recognition-on-chileanMultiple LSTM-CRF
Micro F1 (Exact Span): 80.5

Construire l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec du co-codage IA gratuit, un environnement prêt à l'emploi et les meilleurs prix GPU.

Co-codage IA
GPU prêts à utiliser
Meilleurs prix
Commencer

Hyper Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
Simple mais Puissant : Une Architecture Méconnue pour la Reconnaissance de Noms Intégrés | Articles de recherche | HyperAI