Command Palette
Search for a command to run...
Ensemble De Données De Réponses Aux Questions Sur Les Romans Classiques AnonyRAG
Date
URL de l'article
Licence
Non-Commercial
*Cet ensemble de données prend en charge l'utilisation en ligne.Cliquez ici pour sauter.
AnonyRAG est un ensemble de données de questions-réponses pour les tâches d'anonymisation d'entités publié par Tencent Youtu Lab, l'Université Monash et l'Université polytechnique de Hong Kong en 2025. Les résultats de l'article associé sont "Youtu-GraphRAG : Agents unifiés verticalement pour la recherche de graphes et le raisonnement complexe augmenté", qui vise à évaluer si le système de génération augmentée de récupération (RAG) s'appuie sur la récupération pour obtenir des preuves lorsque les entités sont anonymisées.
Cet ensemble de données est tiré de quatre romans classiques : Au bord de l'eau, Le Rêve dans le pavillon rouge, Moby Dick et Middlemarch. Il couvre à la fois les paires de questions-réponses et des extraits de texte, et est disponible en chinois et en anglais. La partie questions-réponses contient environ 1 397 questions, dont des questions et réponses générales, des questions à choix multiples et des tâches de récupération d'anonymisation d'entités, classées par catégories : simples et complexes. La partie texte fournit des paragraphes de texte comme corpus de récupération pour soutenir les tâches de questions-réponses. Il est adapté à l'évaluation de modèles RAG, à la recherche complexe de raisonnement multi-sauts, au développement de systèmes de questions-réponses de connaissances, ainsi qu'aux tâches d'anonymisation et de récupération d'entités.
Construire l'IA avec l'IA
De l'idée au lancement — accélérez votre développement IA avec du co-codage IA gratuit, un environnement prêt à l'emploi et les meilleurs prix GPU.