HyperAI超神経

HalluQA 中国大型モデル幻覚評価データセット

日付

1年前

組織

上海人工知能研究所
復旦大学

公開URL

github.com

ダウンロードヘルプ
特色图像

このリポジトリには、HalluQA (中国の幻覚質問応答) ベンチマークのデータと評価スクリプトが含まれています。 HalluQA の完全なデータは HalluQA.json にあります。 HalluQA を紹介する論文と複数の中国語大規模言語モデルの詳細な実験結果は、ここ。 HalluQA には、複数の分野にまたがり、中国の歴史、文化、習慣、社会現象を考慮して、慎重に設計された 450 の敵対的な質問が含まれています。