Command Palette
Search for a command to run...

초록
우리는 강력한 실세계 문서 이해, 긴 비디오 이해 및 추론 작업을 위해 설계된 'Nemotron 시리즈'의 최신 모델인 Nemotron Nano V2 VL을 소개합니다. Nemotron Nano V2 VL은 모델 아키텍처, 데이터셋, 훈련 방법론 측면에서의 획기적인 개선을 통해, 이전 모델인 Llama-3.1-Nemotron-Nano-VL-8B에 비해 시각 및 텍스트 전반에 걸쳐 뚜렷한 성능 향상을 제공합니다. 이 모델은 하이브리드 Mamba-Transformer 기반의 대규모 언어 모델(Nemotron Nano V2)을 기반으로 하며, 혁신적인 토큰 축소 기술을 도입하여 긴 문서 및 비디오 시나리오에서 더 높은 추론 처리량을 달성합니다. 이번에 BF16, FP8, FP4 포맷의 모델 체크포인트를 공개하고, 대규모 데이터셋, 훈련 레시피 및 훈련 코드의 주요 부분을 공유합니다.