HyperAIHyperAI

Command Palette

Search for a command to run...

Aria : un modèle ouvert multimodal natif à mélange d'experts

Dongxu Li Yudong Liu Haoning Wu Yue Wang Zhiqi Shen Bowen Qu Xinyao Niu Guoyin Wang Bei Chen Junnan Li

Résumé

Les informations se présentent sous diverses modalités. Les modèles d’intelligence artificielle nativement multimodaux sont essentiels pour intégrer les informations du monde réel et offrir une compréhension globale. Bien qu’il existe des modèles multimodaux natifs propriétaires, leur manque de transparence constitue un obstacle majeur à leur adoption, encore plus à leur adaptation. Pour combler ce vide, nous introduisons Aria, un modèle multimodal natif open source offrant des performances de premier plan sur une large gamme de tâches multimodales, linguistiques et de codage. Aria est un modèle à mélanges d’experts, avec respectivement 3,9 milliards et 3,5 milliards de paramètres activés par jeton visuel et jeton textuel. Il surpasser Pixtral-12B et Llama3.2-11B, et se positionne en concurrence avec les meilleurs modèles propriétaires sur diverses tâches multimodales. Nous avons pré-entraîné Aria de zéro selon un pipeline en quatre étapes, qui confère progressivement au modèle des capacités solides en compréhension linguistique, compréhension multimodale, gestion de fenêtres contextuelles longues et suivi d’instructions. Nous mettons à disposition, en open source, les poids du modèle ainsi qu’une base de code facilitant son adoption et son adaptation dans des applications du monde réel.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
Aria : un modèle ouvert multimodal natif à mélange d'experts | Articles | HyperAI