HyperAIHyperAI

Command Palette

Search for a command to run...

幻覚評価

Hallucination Evaluation は、自然言語処理の分野において重要なタスクであり、大規模言語モデルが非幻覚的なテキストを生成する能力や幻覚を識別する能力を評価することを目指しています。このタスクでは、モデルの出力に含まれる情報が入力で提示された事実と矛盾しているかどうかを検出します。これにより、生成されたコンテンツの正確性と信頼性を確保し、モデルの実世界での信凭性を向上させることが可能となります。

データなし
このタスクで利用可能なベンチマークデータがありません