HyperAIHyperAI

Command Palette

Search for a command to run...

Transfert de Modèles et de Données pour l'Étiquetage de Séquences en Contexte Croisé et à Ressources Nulles

Iker García-Ferrero Rodrigo Agerri German Rigau

Résumé

Les approches de transfert croisé à zéro ressource visent à appliquer des modèles supervisés d'une langue source à des langues cibles non étiquetées. Dans cet article, nous menons une étude approfondie des deux principales techniques utilisées jusqu'à présent pour l'étiquetage séquentiel croisé à zéro ressource, basées soit sur le transfert de données, soit sur le transfert de modèle. Bien que les recherches précédentes aient proposé la traduction et la projection d'annotations (transfert croisé de données basé sur les données) comme une technique efficace pour l'étiquetage séquentiel croisé, dans cet article, nous démontrons expérimentalement que les modèles linguistiques multilingues à forte capacité appliqués dans un cadre zéro-shot (transfert croisé de modèle basé sur le modèle) surpassent constamment les approches de transfert croisé basées sur les données. Une analyse détaillée de nos résultats suggère que cela pourrait être dû à des différences importantes dans l'utilisation des langues. Plus précisément, la traduction automatique génère souvent un signal textuel différent de celui auquel les modèles sont exposés lorsqu'ils utilisent des données standards d'or, ce qui affecte tant le processus d'affinage que celui d'évaluation. Nos résultats indiquent également que les approches de transfert croisé basées sur les données restent une option compétitive lorsque des modèles linguistiques multilingues à forte capacité ne sont pas disponibles.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
Transfert de Modèles et de Données pour l'Étiquetage de Séquences en Contexte Croisé et à Ressources Nulles | Articles | HyperAI