il y a 6 mois

Résumé

Dans cet article, nous introduisons une méthode d’adaptation de faible rang inspirée par les sous-espaces, appelée LoRA à sous-espaces (LoRA sous-espaces), qui est à la fois efficace sur le plan computationnel, facile à implémenter et directement applicable aux grands modèles linguistiques, multimodaux et de diffusion. Initialement, nous décomposons équivalentement les poids de la LoRA en deux sous-espaces, et constatons qu’un simple mélange de ces sous-espaces améliore les performances. Pour étudier ce phénomène, nous le réexaminons à travers une optique fine de sous-espaces, en montrant que cette modification équivaut à utiliser un mélangeur fixe pour fusionner les sous-espaces. Afin d’augmenter la flexibilité, nous apprenons conjointement le mélangeur avec les poids initiaux de la LoRA, et désignons cette méthode comme MoSLoRA (Mixture-of-Subspaces LoRA). La MoSLoRA surpasse de manière cohérente la LoRA sur diverses tâches, incluant le raisonnement sur le sens commun, l’ajustement par instruction visuelle et la génération d’images à partir de texte guidée par un sujet, démontrant ainsi son efficacité et sa robustesse. Le code est disponible à l’adresse suivante : https://github.com/wutaiqiang/MoSLoRA{github}.

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

il y a 6 mois

LLM

Transformer

Apprentissage Profond

Domaine De Recherche

Approche/Framework

Taiqiang Wu Jiahao Wang Zhe Zhao Ngai Wong

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

il y a 6 mois

LLM

Transformer

Apprentissage Profond

Domaine De Recherche

Approche/Framework

Taiqiang Wu Jiahao Wang Zhe Zhao Ngai Wong

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

Mélange de sous-espaces dans l'adaptation de faible rang | Articles | HyperAI

Command Palette

Mélange de sous-espaces dans l'adaptation de faible rang

Taiqiang Wu Jiahao Wang Zhe Zhao Ngai Wong

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Mélange de sous-espaces dans l'adaptation de faible rang

Taiqiang Wu Jiahao Wang Zhe Zhao Ngai Wong

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Mélange de sous-espaces dans l'adaptation de faible rang

Taiqiang Wu Jiahao Wang Zhe Zhao Ngai Wong

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters