HyperAIHyperAI

Command Palette

Search for a command to run...

Skalengesetze für optimale Datendurchmischungen

Mustafa Shukor Louis Bethune Dan Busbridge David Grangier Enrico Fini Alaaeldin El-Nouby Pierre Ablin

Zusammenfassung

Große Grundmodelle werden in der Regel auf Daten aus mehreren Domänen trainiert, wobei die Datenmischung – der Anteil jeder Domäne, der verwendet wird – eine entscheidende Rolle für die Modellleistung spielt. Der Standardansatz zur Auswahl dieser Mischung basiert auf Ausprobieren und Fehlerfinden, was bei groß angelegtem Vortraining unpraktikabel wird. Wir schlagen eine systematische Methode vor, um die optimale Datenmischung für jede Ziel-Domäne unter Verwendung von Skalierungsgesetzen zu bestimmen. Unser Ansatz prognostiziert die Verlustfunktion eines Modells der Größe ( N ), das mit ( D ) Token und einem bestimmten Domänen-Gewichtungsvektor ( h ) trainiert wurde, genau. Wir überprüfen die Universalität dieser Skalierungsgesetze durch die Demonstration ihrer Prognosekraft in drei unterschiedlichen und groß angelegten Szenarien: dem Vortraining von großen Sprachmodellen (LLM), nativen multimodalen Modellen (NMM) und großen visuellen Modellen (LVM). Darüber hinaus zeigen wir, dass diese Skalierungsgesetze auf neue Datenmischungen und verschiedene Skalen extrapolieren können: Ihre Parameter können mittels einiger kleiner Trainingsläufe genau geschätzt werden und dann zur Leistungsprognose bei größeren Skalen und unbekannten Domänen-Gewichtungen verwendet werden. Die Skalierungsgesetze ermöglichen es, die optimalen Domänen-Gewichte für jede Ziel-Domäne unter einem gegebenen Trainingsbudget (( N ), ( D )) abzuleiten, was eine fundierte Alternative zu kostspieligen Ausprobier-Methoden darstellt.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
Skalengesetze für optimale Datendurchmischungen | Paper | HyperAI