HyperAIHyperAI

Command Palette

Search for a command to run...

DoRA : Adaptation par Faible Rang à Décomposition de Poids

Shih-Yang Liu Chien-Yi Wang Hongxu Yin Pavlo Molchanov Yu-Chiang Frank Wang Kwang-Ting Cheng Min-Hung Chen

Résumé

Parmi les méthodes largement utilisées de fine-tuning efficace en paramètres (PEFT), LoRA et ses variantes ont connu une popularité croissante en raison de leur capacité à éviter des coûts supplémentaires lors de l’inférence. Toutefois, un écart de précision subsiste fréquemment entre ces approches et le fine-tuning complet (FT). Dans ce travail, nous introduisons tout d’abord une nouvelle analyse de décomposition des poids afin d’étudier les différences intrinsèques entre FT et LoRA. À partir de ces observations, nous proposons une méthode appelée Weight-Decomposed Low-Rank Adaptation (DoRA), conçue pour imiter la capacité d’apprentissage du FT. DoRA décompose les poids pré-entraînés en deux composantes : une composante de magnitude et une composante de direction, et procède au fine-tuning en utilisant spécifiquement LoRA pour les mises à jour directionnelles, permettant ainsi de minimiser efficacement le nombre de paramètres à entraîner. En utilisant \ours, nous améliorons à la fois la capacité d’apprentissage et la stabilité d’entraînement de LoRA, sans introduire de surcoût d’inférence. \ours~surpasse de manière cohérente LoRA sur le fine-tuning de LLaMA, LLaVA et VL-BART sur diverses tâches downstream, telles que le raisonnement communautaire, le fine-tuning d’instructions visuelles et la compréhension d’images/vidéos-texte. Le code est disponible à l’adresse suivante : https://github.com/NVlabs/DoRA.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp