HyperAIHyperAI

Command Palette

Search for a command to run...

HalluQA 中国大型モデル幻覚評価データセット

Discordで議論

日付

2年前

データセット構成

上海人工知能研究所
復旦大学

公開URL

github.com

Paper URL

arxiv.org

Featured Image

このリポジトリには、HalluQA (中国の幻覚質問応答) ベンチマークのデータと評価スクリプトが含まれています。 HalluQA の完全なデータは HalluQA.json にあります。 HalluQA を紹介する論文と複数の中国語大規模言語モデルの詳細な実験結果は、ここ。 HalluQA には、複数の分野にまたがり、中国の歴史、文化、習慣、社会現象を考慮して、慎重に設計された 450 の敵対的な質問が含まれています。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています