HyperAI

Ensemble De Données D'évaluation Des Hallucinations Du Grand Modèle Chinois HalluQA

Date

il y a un an

Organisation

Laboratoire d'intelligence artificielle de Shanghai
Université Fudan

URL de publication

github.com

Aide au téléchargement
特色图像

Ce référentiel contient des données et des scripts d'évaluation pour le benchmark HalluQA (Chinese Halluciated Question Answering). Les données complètes de HalluQA se trouvent dans HalluQA.json. L'article présentant HalluQA et les résultats expérimentaux détaillés de plusieurs grands modèles linguistiques pour le chinois sont disponibles à l'adresseici. HalluQA contient 450 questions contradictoires soigneusement conçues couvrant plusieurs domaines et prenant en compte la culture historique, les coutumes et les phénomènes sociaux chinois.