Ensemble De Données De Réponses Aux Questions ZeroSearch
Date
URL de publication
ZeroSearch est un ensemble de données de questions-réponses de haute qualité publié par Alibaba Tongyi Lab en 2025, axé sur la création de capacités de modèle capables de répondre directement aux questions sans recherche externe. Les résultats pertinents de l'étude sont les suivants :ZeroSearch : Encourager la capacité de recherche des LLM sans effectuer de recherche".
L'ensemble de données contient environ 170 000 échantillons, couvrant de multiples domaines de connaissances tels que les connaissances scientifiques, les événements historiques, le divertissement cinématographique et télévisuel, la géographie et les sciences humaines. Cet ensemble de données couvre les questions factuelles, les questions de définition, les questions vrai ou faux, etc., et convient à la formation de modèles de questions-réponses de petite et moyenne taille. Grâce à des paires de questions-réponses soigneusement conçues, il vise à évaluer le raisonnement de bon sens, la mémoire factuelle et les capacités d'inférence logique du modèle, en fournissant des ressources de formation et de test standardisées pour le domaine du traitement du langage naturel.