HyperAIHyperAI

Command Palette

Search for a command to run...

DeepSearchQA Mehrstufiger Datensatz Zur Informationssuche Und Beantwortung Von Fragen

Auf Discord diskutieren

Datum

vor einem Monat

Organisation

Google

Veröffentlichungs-URL

www.kaggle.com

Paper-URL

DeepSearchQA

Lizenz

Apache 2.0

DeepSearchQA ist ein Datensatz zur Informationswiedergewinnung und Faktenbewertung für große Sprachmodelle und intelligente Agenten, der 2025 von Google DeepMind veröffentlicht wurde. Zugehörige Veröffentlichungen umfassen... DeepSearchQA: Die Lücke in der Vollständigkeit von Deep-Research-Agenten schließenZiel ist es, die Planungsfähigkeit des Modells, seine Fähigkeit zur Kontextbewahrung und seine Fähigkeit zur umfassenden Nutzung offener Netzwerkinformationen bei komplexen, mehrstufigen Informationssuchaufgaben zu bewerten.

Dieser Datensatz enthält 900 manuell erstellte Evaluierungsbeispiele aus 17 verschiedenen Domänen. Jedes Beispiel besteht aus einer Fragestellung, der zugehörigen Domänenkategorie, einer Standardantwort zur Evaluierung und einer Antworttypbezeichnung. Es werden Einzelantworten und Antwortsets unterschieden; bei etwa 651 Fragen (TP3T) muss das Modell ein vollständiges Antwortset bereitstellen. Alle Fragen sind als „Kausalkette“ konzipiert, d. h. die nachfolgende Informationssuche hängt von den Ergebnissen vorheriger Schritte ab. Das Modell muss daher mehrstufige Suchpläne ausführen und die Kontextkonsistenz langfristig gewährleisten. Alle Aufgaben basieren auf offenen Netzwerken, wodurch objektive und überprüfbare Antworten sichergestellt werden. Der Datensatz dient primär der Evaluierung großer Sprachmodelle oder intelligenter Agentensysteme mit Netzwerk-Suchfunktionen.

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp