HyperAI

초록

우리는 강력한 실세계 문서 이해, 긴 비디오 이해 및 추론 작업을 위해 설계된 'Nemotron 시리즈'의 최신 모델인 Nemotron Nano V2 VL을 소개합니다. Nemotron Nano V2 VL은 모델 아키텍처, 데이터셋, 훈련 방법론 측면에서의 획기적인 개선을 통해, 이전 모델인 Llama-3.1-Nemotron-Nano-VL-8B에 비해 시각 및 텍스트 전반에 걸쳐 뚜렷한 성능 향상을 제공합니다. 이 모델은 하이브리드 Mamba-Transformer 기반의 대규모 언어 모델(Nemotron Nano V2)을 기반으로 하며, 혁신적인 토큰 축소 기술을 도입하여 긴 문서 및 비디오 시나리오에서 더 높은 추론 처리량을 달성합니다. 이번에 BF16, FP8, FP4 포맷의 모델 체크포인트를 공개하고, 대규모 데이터셋, 훈련 레시피 및 훈련 코드의 주요 부분을 공유합니다.

NVIDIA Nemotron Nano V2 VL

NVIDIA Amala Sanjay Deshmukh Kateryna Chumachenko Tuomas Rintamaki Matthieu Le Tyler Poon Danial Mohseni Taheri Ilia Karmanov Guilin Liu Jarno Seppanen

초록

AI로 AI 구축

Hyper Newsletters

Command Palette

NVIDIA Nemotron Nano V2 VL

NVIDIA Amala Sanjay Deshmukh Kateryna Chumachenko Tuomas Rintamaki Matthieu Le Tyler Poon Danial Mohseni Taheri Ilia Karmanov Guilin Liu Jarno Seppanen116 more

초록

AI로 AI 구축

Hyper Newsletters

NVIDIA Amala Sanjay Deshmukh Kateryna Chumachenko Tuomas Rintamaki Matthieu Le Tyler Poon Danial Mohseni Taheri Ilia Karmanov Guilin Liu Jarno Seppanen