Command Palette
Search for a command to run...

要約
Nemotron Nano V2 VLを発表します。これは、実世界のドキュメント理解、長時間の動画理解、推論タスクに強い性能を発揮する「Nemotron視覚言語シリーズ」の最新モデルです。Nemotron Nano V2 VLは、モデルアーキテクチャ、データセット、トレーニング手法の大幅な改善により、前バージョンであるLlama-3.1-Nemotron-Nano-VL-8Bと比較して、視覚およびテキストのあらゆる領域で顕著な性能向上を実現しました。本モデルは、ハイブリッドMamba-Transformer型の大規模言語モデル「Nemotron Nano V2」と、革新的なトークン削減技術を統合することで、長文書や長時間動画処理における推論スループットをさらに向上させています。本モデルのチェックポイントをBF16、FP8、FP4形式で公開し、データセットの大部分、トレーニングのレシピおよびトレーニングコードの一部も共有いたします。