HyperAI

HalluQA Chinesischer Datensatz Zur Bewertung Großer Halluzinationsmodelle

Datum

vor einem Jahr

Organisation

Shanghaier Labor für künstliche Intelligenz
Fudan-Universität

Veröffentlichungs-URL

github.com

Download-Hilfe
特色图像

Dieses Repository enthält Daten und Auswertungsskripte für den HalluQA-Benchmark (Chinese Halluciated Question Answering). Die vollständigen Daten von HalluQA befinden sich in HalluQA.json. Das Papier zur Einführung von HalluQA und detaillierte experimentelle Ergebnisse mehrerer großer Sprachmodelle für Chinesisch sind verfügbar unterHier. HalluQA enthält 450 sorgfältig gestaltete, kontroverse Fragen, die mehrere Bereiche abdecken und die chinesische historische Kultur, Bräuche und soziale Phänomene berücksichtigen.