Command Palette
Search for a command to run...
Ensemble De Données DeepSearchQA Pour La Recherche d'informations En Plusieurs Étapes Et La Réponse Aux Questions
Date
Publish URL
Paper URL
License
Apache 2.0
DeepSearchQA est un ensemble de données de recherche d'informations et d'évaluation factuelle destiné aux grands modèles de langage et aux agents intelligents. Il a été publié par Google DeepMind en 2025. Parmi les articles de recherche associés, on peut citer… DeepSearchQA : Combler le fossé d’exhaustivité pour les agents de recherche approfondieL'objectif est d'évaluer la capacité du modèle à planifier, à préserver le contexte et à utiliser de manière exhaustive les informations des réseaux ouverts dans des tâches de recherche d'informations complexes et à plusieurs étapes.
Cet ensemble de données contient 900 exemples d'évaluation conçus manuellement, couvrant 17 domaines différents. Chaque exemple comprend une question, la catégorie de domaine correspondante, une réponse standard pour l'évaluation et une étiquette indiquant le type de réponse. Les réponses sont classées en réponses uniques et ensembles de réponses. Environ 651 questions (TP3T) exigent du modèle qu'il fournisse un ensemble complet de réponses. Toutes les questions sont conçues selon une structure de type « chaîne causale », ce qui signifie que la recherche d'informations ultérieure dépend des résultats des étapes précédentes. Le modèle doit donc exécuter des plans de recherche en plusieurs étapes et maintenir une cohérence contextuelle à long terme. Toutes les tâches reposent sur des réseaux ouverts, garantissant des réponses objectives et vérifiables. Cet ensemble de données est principalement utilisé pour évaluer de grands modèles de langage ou des systèmes d'agents intelligents dotés de capacités de recherche en réseau.
Build AI with AI
From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.