Command Palette

Search for a command to run...

17일 전

NVIDIA Nemotron Nano V2 VL

NVIDIA Nemotron Nano V2 VL

초록

우리는 강력한 실세계 문서 이해, 긴 비디오 이해 및 추론 작업을 위해 설계된 'Nemotron 시리즈'의 최신 모델인 Nemotron Nano V2 VL을 소개합니다. Nemotron Nano V2 VL은 모델 아키텍처, 데이터셋, 훈련 방법론 측면에서의 획기적인 개선을 통해, 이전 모델인 Llama-3.1-Nemotron-Nano-VL-8B에 비해 시각 및 텍스트 전반에 걸쳐 뚜렷한 성능 향상을 제공합니다. 이 모델은 하이브리드 Mamba-Transformer 기반의 대규모 언어 모델(Nemotron Nano V2)을 기반으로 하며, 혁신적인 토큰 축소 기술을 도입하여 긴 문서 및 비디오 시나리오에서 더 높은 추론 처리량을 달성합니다. 이번에 BF16, FP8, FP4 포맷의 모델 체크포인트를 공개하고, 대규모 데이터셋, 훈련 레시피 및 훈련 코드의 주요 부분을 공유합니다.

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 공동 코딩, 즉시 사용 가능한 환경, 최적 가격 GPU로 AI 개발을 가속화하세요.

AI 공동 코딩
즉시 사용 가능한 GPU
최적 가격
시작하기

Hyper Newsletters

최신 정보 구독하기
한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다
이메일 서비스 제공: MailChimp
NVIDIA Nemotron Nano V2 VL | 연구 논문 | HyperAI초신경