Alignement de séquences par ensemble à l’aide d’un seul réseau neuronal pour l’étiquetage de séquences
L’étiquetage de séquences, qui consiste à attribuer une classe ou une étiquette à chaque token dans un ordre d’entrée donné, est une tâche fondamentale en traitement du langage naturel. De nombreuses architectures avancées de réseaux neuronaux ont récemment été proposées pour résoudre le problème d’étiquetage séquentiel auquel cette tâche est soumise. En revanche, très peu d’approches ont été proposées pour traiter le problème d’ensembles séquentiels. Dans cet article, nous résolvons ce problème d’ensembles séquentiels en appliquant la méthode d’alignement séquentiel dans un cadre d’ensemble proposé. Plus précisément, nous proposons un cadre simple mais efficace pour la génération de candidats d’ensembles, permettant ainsi de préparer facilement plusieurs systèmes hétérogènes à partir d’un seul réseau neuronal d’étiquetage de séquences. Pour évaluer le cadre proposé, des expériences ont été menées sur les problèmes d’étiquetage des parties du discours (POS) et de prédiction des étiquettes de dépendance. Les résultats montrent que le cadre proposé a atteint des taux de précision supérieurs de 0,19 et de 0,33 respectivement par rapport à la méthode de vote dur sur les jeux de données Penn-treebank pour l’étiquetage POS et Universal Dependency pour l’étiquetage de dépendance.