HyperAIHyperAI

Command Palette

Search for a command to run...

CAN-NER : Réseau de Convolution avec Attention pour la Reconnaissance des Entités Nommées en Chinois

Yuying Zhu; Guoxin Wang; Börje F. Karlsson

Résumé

La reconnaissance d'entités nommées (NER) en chinois est essentielle mais difficile en raison du manque de délimiteurs naturels. Par conséquent, la segmentation des mots chinois (CWS) est généralement considérée comme la première étape pour la NER en chinois. Cependant, les modèles basés sur des plongements (embeddings) au niveau des mots et des caractéristiques lexicographiques souffrent souvent d'erreurs de segmentation et de mots hors vocabulaire (OOV). Dans cet article, nous examinons un réseau de neurones à attention convolutive appelé CAN pour la NER en chinois, qui comprend un réseau neuronal convolutif (CNN) basé sur les caractères avec une couche d'attention locale et une unité récurrente à porte (GRU) avec une couche d'attention globale auto-appliquée pour capturer les informations provenant des caractères adjacents et des contextes de phrase. De plus, comparativement à d'autres modèles, notre modèle ne dépend d'aucune ressource externe telle que des lexicons et utilise des plongements de caractères de petite taille, ce qui le rend plus pratique. Des résultats expérimentaux approfondis montrent que notre approche surpassent les méthodes les plus avancées sans plongements de mots ni ressources lexicographiques externes sur différents jeux de données par domaine, y compris ceux du Weibo, du MSRA et du jeu de données NER pour les curriculum vitae chinois.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp