Command Palette
Search for a command to run...

Résumé
Nous présentons Nemotron Nano V2 VL, le dernier modèle de la série vision-langage Nemotron, conçu pour une compréhension avancée des documents du monde réel, une analyse approfondie des vidéos longues et des tâches de raisonnement. Nemotron Nano V2 VL apporte des améliorations significatives par rapport à notre modèle précédent, Llama-3.1-Nemotron-Nano-VL-8B, dans tous les domaines visuels et textuels, grâce à des avancées majeures dans l’architecture du modèle, les jeux de données et les procédés d’entraînement. Basé sur Nemotron Nano V2, un modèle hybride Mamba-Transformer à grande taille (LLM), et intégrant des techniques innovantes de réduction de tokens, Nemotron Nano V2 VL permet d’obtenir un débit d’inférence plus élevé dans les scénarios impliquant des documents ou vidéos longs. Nous mettons à disposition des points de contrôle du modèle en formats BF16, FP8 et FP4, ainsi qu’une grande partie de nos jeux de données, recettes d’entraînement et code d’entraînement.
Construire l'IA avec l'IA
De l'idée au lancement — accélérez votre développement IA avec du co-codage IA gratuit, un environnement prêt à l'emploi et les meilleurs prix GPU.