Ensemble De Données D'évaluation Des Hallucinations Du Grand Modèle Chinois HalluQA
Date
il y a un an
URL de publication
Catégories

Ce référentiel contient des données et des scripts d'évaluation pour le benchmark HalluQA (Chinese Halluciated Question Answering). Les données complètes de HalluQA se trouvent dans HalluQA.json. L'article présentant HalluQA et les résultats expérimentaux détaillés de plusieurs grands modèles linguistiques pour le chinois sont disponibles à l'adresseici. HalluQA contient 450 questions contradictoires soigneusement conçues couvrant plusieurs domaines et prenant en compte la culture historique, les coutumes et les phénomènes sociaux chinois.