HyperAIHyperAI
il y a 2 mois

Simplifier l'utilisation du lexique dans la reconnaissance d'entités nommées en chinois

Ruotian Ma; Minlong Peng; Qi Zhang; Xuanjing Huang
Simplifier l'utilisation du lexique dans la reconnaissance d'entités nommées en chinois
Résumé

Récemment, de nombreuses études ont tenté d'améliorer les performances de la reconnaissance d'entités nommées (NER) en chinois en utilisant des lexiques de mots. Comme exemple représentatif, le Lattice-LSTM (Zhang et Yang, 2018) a obtenu de nouveaux résultats de référence sur plusieurs jeux de données publics de NER chinois. Cependant, l'architecture du modèle Lattice-LSTM est complexe, ce qui limite son application dans de nombreux secteurs industriels où des réponses de NER en temps réel sont nécessaires.Dans cette étude, nous proposons une méthode simple mais efficace pour intégrer le lexique de mots aux représentations de caractères. Cette méthode évite la conception d'une architecture de modélisation séquentielle compliquée et ne nécessite que des ajustements subtils du niveau de représentation des caractères pour introduire les informations du lexique. Des études expérimentales menées sur quatre jeux de données de référence pour la NER chinoise montrent que notre méthode atteint une vitesse d'inférence jusqu'à 6,15 fois plus rapide que celle des méthodes les plus avancées actuellement disponibles, tout en offrant une meilleure performance. Les résultats expérimentaux montrent également que la méthode proposée peut être facilement combinée avec des modèles pré-entraînés tels que BERT.

Simplifier l'utilisation du lexique dans la reconnaissance d'entités nommées en chinois | Articles de recherche récents | HyperAI