HyperAIHyperAI

Command Palette

Search for a command to run...

Neue NVIDIA Nemotron-Modelle für sichere, multimodale AI-Agenten

NVIDIA hat auf der GTC DC neue Spezialmodelle für agente-basierte KI vorgestellt, die Entwicklern helfen, leistungsstarke, sicherheitsorientierte und domänenspezifische KI-Systeme zu bauen. Zentrale Neuerungen sind die Nemotron-Serie – bestehend aus dem 32B-Parameter-MoE-Modell Nemotron Nano 3, dem multimodalen Nemotron Nano 2 VL für Dokumenten- und Videoanalyse, dem kompakten Nemotron Parse 1.1 zur strukturierten Dokumentenauswertung, einer neuen RAG-Suite für informationsbasierte KI und dem Llama 3.1 Nemotron Safety Guard 8B V3 für multilinguale Inhaltsmoderation. Alle Modelle sind mit offenen Daten, Rezepten und Inference-Unterstützung (vLLM, TRT-LLM) versehen und als NVIDIA NIM verfügbar, was die Skalierung in Produktion vereinfacht. Nemotron Nano 3 ist ein effizienter Mixture-of-Experts-Modell mit nur 3,6B aktiven Parametern, der durch seine Architektur höhere Durchsatzraten und geringere Latenz bei gleichzeitig hoher Genauigkeit bei wissenschaftlichem Denken, Programmierung und mathematischer Reasoning erreicht – ideal für autonome Agenten. Nemotron Nano 2 VL setzt neue Maßstäbe in der multimodalen Verarbeitung: Mit einer Hybrid-Architektur aus Mamba und Transformer, der Efficient Video Sampling (EVS)-Technik zur Reduzierung redundanter Video-Teile und der Nutzung von FP8-Präzision, verarbeitet es lange Videos und Dokumente effizienter. Es erreicht Spitzenwerte auf Benchmarks wie OCRBenchV2 und PubTabNet, was es zu einem Schlüsselmodell für Anwendungen wie automatisierte Berichterstattung, Medienverwaltung und visuelle Suche macht. Nemotron Parse 1.1 ist ein kleiner, aber leistungsfähiger VLM-Parser, der Bilder von Dokumenten analysiert und strukturierte Ausgaben mit Text, Tabellen und Layoutinformationen liefert – entscheidend für präzise Retrieval-Systeme und verbesserte LLM-Trainingsdaten. Die Nemotron RAG-Suite ermöglicht sichere, unternehmensinterne Retrieval-augmented Generation mit Datenschutz und Integration in proprietäre Datenquellen. Sie unterstützt komplexe Multi-Agenten-Systeme und Co-Pilot-Anwendungen in HR, IT-Support und Kundenservice. Die eingebetteten Modelle zeigen herausragende Leistung in Benchmark-Suiten wie ViDoRe, MTEB und MMTEB. Ein zentrales Anliegen ist die Sicherheit: Der Llama 3.1 Nemotron Safety Guard 8B V3 ist ein multilinguales Moderationsmodell, das in neun Sprachen (u.a. Arabisch, Japanisch, Hindi) und 23 kulturell angepassten Sicherheitskategorien arbeitet. Er nutzt LLM-gestützte kulturelle Anpassung und Konsistenzfilter, um falsche oder fehlerhafte Beispiele zu eliminieren. Mit 84,2 % Genauigkeit bei geringer Latenz ist er ideal für Echtzeit-Modération in globalen KI-Workflows. Zusätzlich wurde das NeMo Evaluator SDK und der NeMo Agent Toolkit erweitert. Der Toolkit bietet automatisierte Optimierung (Agent Optimizer) für Hyperparameter wie Temperatur, Token-Limit und LLM-Typ, wodurch Entwicklungszyklen verkürzt werden. ProfBench-Unterstützung ermöglicht die Bewertung von agierenden Systemen in dynamischen, interaktiven Szenarien. Bewertung durch Branchenexperten: Die Einführung der Nemotron-Modelle markiert einen bedeutenden Schritt hin zu praktikabler, sicherer und skalierbarer Agentic AI. Experten loben die Kombination aus Offenheit, Effizienz und industriellen Anwendbarkeiten. Besonders hervorgehoben wird die Integration von Sicherheits- und Evaluationswerkzeugen, die bisher oft fehlten. Unternehmen können nun schnell und verantwortungsvoll KI-Agenten für komplexe Geschäftsprozesse entwickeln. NVIDIA positioniert sich damit klar als führender Player im Bereich Enterprise-KI-Infrastruktur – besonders durch die Verbindung von Hardware (GPU), Software (NeMo, TRT-LLM) und Open-Source-Ökosystemen.

Verwandte Links

Neue NVIDIA Nemotron-Modelle für sichere, multimodale AI-Agenten | Aktuelle Beiträge | HyperAI