HyperAIHyperAI

Command Palette

Search for a command to run...

Une relaxation continue de la recherche en faisceau pour l'entraînement de bout en bout des modèles de séquence neuronaux

Kartik Goyal Graham Neubig Chris Dyer Taylor Berg-Kirkpatrick

Résumé

La recherche en faisceau (beam search) est une méthode de décodage souhaitable pour les modèles de séquences neuronaux car elle évite potentiellement les erreurs de recherche commises par des méthodes plus simples et gourmandes. Cependant, les procédures d'entraînement habituelles par entropie croisée pour ces modèles ne prennent pas directement en compte le comportement de la méthode de décodage finale. Par conséquent, pour les modèles entraînés par entropie croisée, le décodage en faisceau peut parfois entraîner une performance réduite lors des tests comparativement au décodage gourmand. Afin d'entraîner des modèles qui peuvent utiliser plus efficacement la recherche en faisceau, nous proposons une nouvelle procédure d'entraînement qui se concentre sur la métrique de perte finale (par exemple, la perte de Hamming) évaluée sur la sortie de la recherche en faisceau. Bien que bien définie, cette objectif de « perte directe » est lui-même discontinu et donc difficile à optimiser. Par conséquent, dans notre approche, nous formons un objectif substitut sous-différentiable en introduisant une nouvelle approximation continue de la procédure de décodage en faisceau. Dans nos expériences, nous montrons que l'optimisation de cet nouvel objectif d'entraînement produit des résultats substantiellement meilleurs sur deux tâches de séquence (Reconnaissance d'Entités Nommées et Étiquetage Supertagging CCG) comparativement aux baselines du décodage gourmand et du décodage en faisceau entraînés par entropie croisée.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
Une relaxation continue de la recherche en faisceau pour l'entraînement de bout en bout des modèles de séquence neuronaux | Articles | HyperAI