HyperAIHyperAI

Command Palette

Search for a command to run...

Génération neurale pour le tchèque : données et bases de comparaison

Filip Jur\vc\'\i\vcek Ond\vrej Du\vsek

Résumé

Nous présentons le premier jeu de données dédié à la génération de langage naturel (NLG) en bout-à-bout en tchèque, dans le domaine des restaurants, accompagné de plusieurs modèles de base performants utilisant l'approche séquence-à-séquence. Bien que la NLG pour les langues autres que l’anglais soit globalement peu explorée, le tchèque, en tant que langue morphologiquement riche, rend cette tâche encore plus difficile : en effet, le tchèque exige l’inflection des entités nommées, ce qui rend inopérants les mécanismes de délexicalisation ou de copie tels qu’ils sont habituellement appliqués, et la lexicalisation des sorties générées s’avère non triviale. Dans nos expériences, nous proposons deux approches différentes pour résoudre ce problème : (1) l’utilisation d’un modèle de langage neuronal pour sélectionner la forme inflexionnée correcte lors de la lexicalisation ; (2) un cadre de génération en deux étapes : notre modèle séquence-à-séquence génère une séquence entremêlée de lemmes et d’étiquettes morphologiques, qui sont ensuite inflexionnées par un générateur morphologique.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp