Command Palette
Search for a command to run...
Un modèle de réseau de neurones profond pour la tâche de reconnaissance d'entités nommées
{Anh Le. Mikhail S. Burtsev}

Résumé
L’un des facteurs les plus importants qui influence directement et significativement la qualité de l’étiquetage séquentiel par réseau neuronal est le choix et le codage des caractéristiques d’entrée, afin de générer des vecteurs représentant richement le sens et la grammaire. Dans cet article, nous proposons un modèle de réseau neuronal profond destiné à traiter une tâche particulière du problème d’étiquetage séquentiel, à savoir la reconnaissance d’entités nommées (Named Entity Recognition, NER). Ce modèle se compose de trois sous-réseaux permettant d’exploiter pleinement les caractéristiques au niveau des caractères, les caractéristiques de majuscules ainsi que les représentations contextuelles au niveau des mots. Pour démontrer la capacité de notre modèle à généraliser à différentes langues, nous l’avons évalué sur des données en russe, vietnamien, anglais et chinois, obtenant des performances de pointe : des scores F-mesure respectifs de 91,10 %, 94,43 %, 91,22 % et 92,95 % sur les jeux de données de Gareev, VLSP-2016, CoNLL-2003 et MSRA. En outre, notre modèle a également atteint des performances satisfaisantes (environ 70 % de F1) en utilisant uniquement 100 échantillons pour les ensembles d’entraînement et de développement.
Benchmarks
| Benchmark | Méthodologie | Métriques |
|---|---|---|
| named-entity-recognition-in-vietnamese-on | Bi-LSTM-CNN-CRF | F1: 94.43 |
| named-entity-recognition-ner-on-conll-2003 | Bi-LSTM-CNN-CRF | F1: 91.22 |
Construire l'IA avec l'IA
De l'idée au lancement — accélérez votre développement IA avec du co-codage IA gratuit, un environnement prêt à l'emploi et les meilleurs prix GPU.