HyperAIHyperAI

Command Palette

Search for a command to run...

Ensemble De Données DeepSearchQA Pour La Recherche d'informations En Plusieurs Étapes Et La Réponse Aux Questions

Date

il y a un jour

Organization

Google

Publish URL

www.kaggle.com

Paper URL

DeepSearchQA

License

Apache 2.0

DeepSearchQA est un ensemble de données de recherche d'informations et d'évaluation factuelle destiné aux grands modèles de langage et aux agents intelligents. Il a été publié par Google DeepMind en 2025. Parmi les articles de recherche associés, on peut citer… DeepSearchQA : Combler le fossé d’exhaustivité pour les agents de recherche approfondieL'objectif est d'évaluer la capacité du modèle à planifier, à préserver le contexte et à utiliser de manière exhaustive les informations des réseaux ouverts dans des tâches de recherche d'informations complexes et à plusieurs étapes.

Cet ensemble de données contient 900 exemples d'évaluation conçus manuellement, couvrant 17 domaines différents. Chaque exemple comprend une question, la catégorie de domaine correspondante, une réponse standard pour l'évaluation et une étiquette indiquant le type de réponse. Les réponses sont classées en réponses uniques et ensembles de réponses. Environ 651 questions (TP3T) exigent du modèle qu'il fournisse un ensemble complet de réponses. Toutes les questions sont conçues selon une structure de type « chaîne causale », ce qui signifie que la recherche d'informations ultérieure dépend des résultats des étapes précédentes. Le modèle doit donc exécuter des plans de recherche en plusieurs étapes et maintenir une cohérence contextuelle à long terme. Toutes les tâches reposent sur des réseaux ouverts, garantissant des réponses objectives et vérifiables. Cet ensemble de données est principalement utilisé pour évaluer de grands modèles de langage ou des systèmes d'agents intelligents dotés de capacités de recherche en réseau.

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp