HyperAIHyperAI

Command Palette

Search for a command to run...

il y a 2 mois

TiKMiX : Intégrer l'influence des données dans un mélange dynamique pour l'entraînement préalable des modèles linguistiques

Yifan Wang Binbin Liu Fengze Liu Yuanfan Guo Jiyao Deng Xuecheng Wu Weidong Zhou Xiaohuan Zhou Taifeng Wang

TiKMiX : Intégrer l'influence des données dans un mélange dynamique pour l'entraînement préalable des modèles linguistiques

Résumé

Le mélange de données utilisé lors du préentraînement d’un modèle linguistique constitue un pilier fondamental de sa performance finale. Toutefois, une stratégie statique de mélange s’avère sous-optimale, car les préférences d’apprentissage du modèle pour différents domaines de données évoluent de manière dynamique au cours de l’entraînement. De manière cruciale, observer ces préférences en évolution de manière efficace sur le plan computationnel reste un défi majeur. Pour relever ce défi, nous proposons TiKMiX, une méthode qui ajuste dynamiquement le mélange de données en fonction des préférences évolutives du modèle. TiKMiX introduit le concept de Group Influence, une métrique efficace pour évaluer l’impact des différents domaines de données sur le modèle. Cette métrique permet de formuler le problème du mélange de données comme une recherche d’une distribution optimale maximisant l’influence. Nous résolvons ce problème par deux approches : TiKMiX-D, basée sur une optimisation directe, et TiKMiX-M, qui utilise un modèle de régression pour prédire un mélange supérieur. Nous avons entraîné des modèles avec différents nombres de paramètres, sur jusqu’à 1 trillion de tokens. TiKMiX-D dépasse les performances des méthodes de pointe telles que REGMIX, tout en utilisant uniquement 20 % des ressources computationnelles. TiKMiX-M permet une amélioration moyenne de 2 % sur 9 benchmarks en aval. Nos expériences révèlent que les préférences du modèle en matière de données évoluent avec l’avancement et l’échelle de l’entraînement, et démontrons que l’ajustement dynamique du mélange de données basé sur le Group Influence, une mesure directe de ces préférences, améliore significativement les performances en réduisant le sous-apprentissage des données observé avec des ratios statiques.

Construire l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec du co-codage IA gratuit, un environnement prêt à l'emploi et les meilleurs prix GPU.

Co-codage IA
GPU prêts à utiliser
Meilleurs prix
Commencer

Hyper Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
TiKMiX : Intégrer l'influence des données dans un mélange dynamique pour l'entraînement préalable des modèles linguistiques | Articles de recherche | HyperAI