Datenwissenschaftlicher Agent mit wiederverwendbaren Tools
Das von NVIDIAs KGMON-Team (NeMo Agent Toolkit) entwickelte Data-Explorer-Agent hat im Bereich der intelligenten Datenverarbeitung einen bedeutenden Durchbruch erzielt und belegt in den Benchmark-Tests für mehrstufige Datenaufgaben mit Agenten (DABStep) die Spitzenposition. Das Tool wurde speziell entwickelt, um das Problem knapper quantitativer strukturierter Daten im Textinternet zu lösen, indem es den Arbeitsablauf erfahrener Datenwissenschaftler simuliert, um automatisierte explorative Datenanalyse, Tabellen-Fragenbeantwortung sowie prädiktive Modellierung zu ermöglichen. Bei tabellarischen Daten, die komplexe Mehrstufenabfragen erfordern, versagen herkömmliche, auf Websuche angewiesene Agenten häufig. Der Data Explorer nutzt eine einzigartige Dreiphasen-Architektur: Zunächst erfolgt durch die „Lernphase" die Batch-Bearbeitung von Beispielaufgaben mittels eines großen Sprachmodells, wobei allgemeine Funktionsbibliotheken (helper.py) extrahiert und verpackt werden. Dabei wird verteilte Logik in wiederverwendbare modulare Einheiten integriert, gefolgt vom effizienten Prinzip „einmal schreiben, überall ausführen". In der darauffolgenden „Inferenzphase" kommen leichtgewichtige Schnellmodelle zum Einsatz, die direkt auf die vorab generierten Bibliotheken zugreifen, um neue Aufgaben zu bearbeiten, ohne dass die grundlegende Logik neu erstellt werden muss. Dies reduziert Latenzzeit und Token-Konsum erheblich. Abschließend findet die „Offline-Reflexionsphase" statt, bei der ein großes Sprachmodell vergangene Aufgaben unüberwacht überprüft und auf Konsistenz analysiert, wodurch Erkenntnisse an System-Prompts zurückgespeist werden, was die Genauigkeit der Inferenz kontinuierlich verbessert, ohne die Online-Geschwindigkeit zu beeinträchtigen. Messdaten belegen beeindruckende Ergebnisse des Ansatzes beim DABstep-Benchmark. Bei hochkomplexen Mehrstufen-Inferenzaufgaben erreicht der Data Explorer eine Genauigkeit von bis zu 89,95 %, weit über denen konkurrierender Lösungen mit schweren Modellen wie Claude Code (66,93 %) oder Google AI (45,24 %). Zudem beträgt die Bearbeitungszeit pro Aufgabe lediglich 20 Sekunden, während die Länge des generierten Codes auf 1870 Zeichen verkürzt ist – dies entspricht einer dreißigfachen Effizienzsteigerung gegenüber dem traditionellen manuellen Schreiben von Code von Grund auf. Diese Ergebnisse beweisen, dass die Trennung zwischen Wissensaufbau und schneller Inferenz effektiv ermöglicht, dass leichte Modelle schwere Modelle auch bei komplexer Datenanalyse übertreffen, und etablieren damit eine neue Paradigma für datenintensive Forschung. Aktuell stellt NVIDIA entsprechende Tools zur Verfügung, sodass Entwickler benutzerdefinierte Data-Explorer-Agenten erstellen können.
