HyperAIHyperAI

Command Palette

Search for a command to run...

vor 2 Monaten

Zum allgemeinen agierenden Intelligenz durch Umgebungsskalierung

Zum allgemeinen agierenden Intelligenz durch Umgebungsskalierung

Abstract

Für die praktische Anwendung von großen Sprachmodellen in realen Umgebungen ist fortgeschrittene agenteintelligente Fähigkeiten eine Voraussetzung. Unterschiedliche reale APIs erfordern präzise und robuste Funktionaufrufintelligenz, wobei Agenten diese Fähigkeiten durch Interaktionen in vielfältigen Umgebungen entwickeln müssen. Die Breite der Funktionaufrufkompetenz hängt eng mit der Vielfalt der Umgebungen zusammen, in denen Agenten trainiert werden. In dieser Arbeit erweitern wir die Umgebungen als Schritt hin zu einer Weiterentwicklung der allgemeinen agenteintelligenten Fähigkeiten. Dies führt zu zwei zentralen Herausforderungen: (i) Wie können Umgebungen prinzipiengeleitet skaliert werden? und (ii) Wie können agenteintelligente Fähigkeiten effektiv aus Erfahrungen gewonnen werden, die durch Interaktionen mit diesen Umgebungen entstehen? Um diese Herausforderungen zu meistern, entwickeln wir einen skalierbaren Rahmen, der heterogene, vollständig simulierten Umgebungen automatisch konstruiert und damit systematisch den Raum möglicher Funktionaufruf-Szenarien erweitert. Zudem passen wir eine zweistufige Feinabstimmungsstrategie für Agenten an: Zunächst verleihen wir Agenten grundlegende agenteintelligente Fähigkeiten, anschließend spezialisieren wir sie für domain-spezifische Kontexte. Umfangreiche Experimente an agenteintelligenten Benchmarks – tau-bench, tau2-Bench und ACEBench – zeigen, dass unser trainiertes Modell, AgentScaler, die Funktionaufruffähigkeit von Modellen erheblich verbessert.

KI mit KI entwickeln

Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.

KI-Co-Coding
Sofort einsatzbereit GPUs
Beste Preise
Jetzt starten

Hyper Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
Zum allgemeinen agierenden Intelligenz durch Umgebungsskalierung | Forschungsarbeiten | HyperAI