Command Palette

Search for a command to run...

HalluQA 中国大型モデル幻覚評価データセット

日付

2年前

組織

上海人工知能研究所
復旦大学

公開URL

github.com

論文URL

arxiv.org

Discordコミュニティに参加
Featured Image

このリポジトリには、HalluQA (中国の幻覚質問応答) ベンチマークのデータと評価スクリプトが含まれています。 HalluQA の完全なデータは HalluQA.json にあります。 HalluQA を紹介する論文と複数の中国語大規模言語モデルの詳細な実験結果は、ここ。 HalluQA には、複数の分野にまたがり、中国の歴史、文化、習慣、社会現象を考慮して、慎重に設計された 450 の敵対的な質問が含まれています。

AI で AI を構築

アイデアからローンチまで — 無料の AI 共同コーディング、すぐに使える環境、最適価格の GPU で AI 開発を加速。

AI 共同コーディング
すぐに使える GPU
最適価格
今すぐ始める

Hyper Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています
HalluQA 中国大型モデル幻覚評価データセット | データセット | HyperAI超神経