HyperAIHyperAI

Command Palette

Search for a command to run...

Mélange de sous-espaces dans l'adaptation de faible rang

Taiqiang Wu Jiahao Wang Zhe Zhao Ngai Wong

Résumé

Dans cet article, nous introduisons une méthode d’adaptation de faible rang inspirée par les sous-espaces, appelée LoRA à sous-espaces (LoRA sous-espaces), qui est à la fois efficace sur le plan computationnel, facile à implémenter et directement applicable aux grands modèles linguistiques, multimodaux et de diffusion. Initialement, nous décomposons équivalentement les poids de la LoRA en deux sous-espaces, et constatons qu’un simple mélange de ces sous-espaces améliore les performances. Pour étudier ce phénomène, nous le réexaminons à travers une optique fine de sous-espaces, en montrant que cette modification équivaut à utiliser un mélangeur fixe pour fusionner les sous-espaces. Afin d’augmenter la flexibilité, nous apprenons conjointement le mélangeur avec les poids initiaux de la LoRA, et désignons cette méthode comme MoSLoRA (Mixture-of-Subspaces LoRA). La MoSLoRA surpasse de manière cohérente la LoRA sur diverses tâches, incluant le raisonnement sur le sens commun, l’ajustement par instruction visuelle et la génération d’images à partir de texte guidée par un sujet, démontrant ainsi son efficacité et sa robustesse. Le code est disponible à l’adresse suivante : https://github.com/wutaiqiang/MoSLoRA{github}.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp