HyperAIHyperAI

Command Palette

Search for a command to run...

Le troupeau de modèles Llama 3

Résumé

Les systèmes d’intelligence artificielle modernes reposent sur des modèles fondamentaux.Cet article présente une nouvelle série de modèles fondamentaux, appelés Llama 3. Il s’agit d’un ensemble de modèles linguistiques capables, de manière native, de traiter plusieurs langues, de comprendre et de générer du code, de raisonner et d’utiliser des outils. Notre modèle le plus puissant est un modèle Transformer dense de 405 milliards de paramètres, avec une fenêtre contextuelle pouvant atteindre 128 000 tokens. Cet article présente une évaluation empirique approfondie de Llama 3. Nous constatons que Llama 3 atteint une qualité comparable à celle des modèles linguistiques de pointe, tels que GPT-4, sur un large éventail de tâches. Nous mettons publiquement à disposition Llama 3, incluant les versions pré-entraînées et post-entraînées du modèle linguistique de 405 milliards de paramètres, ainsi que notre modèle Llama Guard 3, dédié à la sécurité des entrées et des sorties. L’article présente également les résultats d’expériences dans lesquelles nous avons intégré, par une approche compositionnelle, des capacités visuelles, vidéo et audio à Llama 3. Nous observons que cette approche se distingue de manière compétitive par rapport aux états de l’art sur les tâches de reconnaissance d’images, de vidéos et de parole. Les modèles issus de ces travaux ne sont pas encore largement diffusés, car ils sont encore en cours de développement.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp