il y a 16 jours
Description de la soumission pour la Tâche partagée SIGMORPHON 2022 sur la segmentation morphémique : Étiquetage de séquence pour la segmentation morphémique au niveau du mot
{Leander Girrbach}

Résumé
Nous proposons une approche de segmentation morphémique au niveau des mots basée sur l’étiquetage de séquences. Les étiquettes de segmentation sont des opérations d’édition issues d’un alignement à distance d’édition minimale modifié. Nous démontrons que l’étiquetage de séquences obtient de bons résultats pour la « segmentation superficielle » et la « segmentation canonique », atteignant un score F1 de 96,06 (moyenné macro sur toutes les langues de la tâche partagée) et se classant au troisième rang parmi toutes les équipes participantes. Par conséquent, nous concluons que l’étiquetage de séquences constitue une approche prometteuse pour la segmentation morphémique.