HalluQA Chinesischer Datensatz Zur Bewertung Großer Halluzinationsmodelle
Datum
vor einem Jahr
Veröffentlichungs-URL
Kategorien

Dieses Repository enthält Daten und Auswertungsskripte für den HalluQA-Benchmark (Chinese Halluciated Question Answering). Die vollständigen Daten von HalluQA befinden sich in HalluQA.json. Das Papier zur Einführung von HalluQA und detaillierte experimentelle Ergebnisse mehrerer großer Sprachmodelle für Chinesisch sind verfügbar unterHier. HalluQA enthält 450 sorgfältig gestaltete, kontroverse Fragen, die mehrere Bereiche abdecken und die chinesische historische Kultur, Bräuche und soziale Phänomene berücksichtigen.