HyperAIHyperAI

Command Palette

Search for a command to run...

DeepPlanning-Datensatz Zur Bewertung Der Langfristigen Planungsfähigkeit

Auf Discord diskutieren

Datum

vor 4 Stunden

Organisation

Alibaba-Gruppe

Paper-URL

2601.18137

Lizenz

Apache 2.0

DeepPlanning ist ein Datensatz zur Bewertung der Planungsfähigkeiten intelligenter Agenten, der 2026 vom Qwen-Team veröffentlicht wurde. Die zugehörige Publikation ist… DeepPlanning: Benchmarking von agentenbasierter Langzeitplanung mit verifizierbaren EinschränkungenZiel ist es, die Denk- und Entscheidungsfähigkeit intelligenter Agenten bei komplexen, langfristigen Planungsaufgaben zu bewerten.

Dieser Datensatz umfasst zwei Aufgabentypen: mehrtägige Reiseplanung und Einkaufsplanung für mehrere Artikel. Die Reiseplanungsaufgabe enthält 120 unabhängige Aufgabenbeispiele in Chinesisch und Englisch. Jede Aufgabe entspricht einer abgeschlossenen Umgebung und beinhaltet strukturierte Hintergrunddaten mit Informationen zu Transport, Unterkunft, Sehenswürdigkeiten, Fahrplänen und Kosten (durchschnittlich ca. 7.700 Datensätze). Die Einkaufsplanungsaufgabe umfasst 120 unabhängige Aufgabenbeispiele in Englisch. Jedes Beispielbeispiel enthält eine Produktdatenbank mit Informationen zu Produktpreisen, Lagerbeständen, Rabattregeln und Budgetbeschränkungen (durchschnittlich ca. 170 Datensätze).

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp