HyperAIHyperAI

Command Palette

Search for a command to run...

Au-delà des caractères : segmentation morphémique au niveau des sous-mots

Andre F. T. Martins Ben Peters

Résumé

Cet article présente les soumissions de DeepSPIN à la tâche partagée SIGMORPHON 2022 sur la segmentation morphémique. Nous présentons trois soumissions, toutes adressées à la sous-tâche au niveau des mots. Premièrement, nous montrons que les modèles séquence-à-séquence à faible densité basés sur entmax apportent des améliorations importantes par rapport aux modèles conventionnels basés sur softmax, confirmant ainsi des résultats observés sur d'autres tâches. Ensuite, nous remettons en question l'hypothèse selon laquelle les modèles destinés aux tâches morphologiques doivent être entraînés au niveau des caractères en concevant un modèle Transformer qui génère les morphèmes sous la forme de séquences de sous-mots induits par un modèle de langage unigramme. Ce Transformer basé sur les sous-mots surpasse tous nos modèles entraînés au niveau des caractères et remporte la sous-tâche au niveau des mots. Bien que nous n'ayons pas soumis une version officielle pour la sous-tâche au niveau des phrases, nous démontrons que cette approche basée sur les sous-mots s'avère tout aussi efficace dans ce contexte.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
Au-delà des caractères : segmentation morphémique au niveau des sous-mots | Articles | HyperAI