HyperAI超神経

HyperAI

複数選択質問応答（MCQA）は、自然言語処理のサブタスクの一つで、モデルが提供された候補オプションとサポート情報に基づいて与えられた質問に対する最適な答えを予測することを要求します。このタスクは、モデルの理解力と推論能力を評価することを目指しており、知能教育、オンライン評価、知識検索など、幅広い応用価値を持っています。

MedMCQA

Meditron-70B (CoT + SC)

BIG-bench (Movie Recommendation)

BIG-bench (Navigate)

BIG-bench (Hyperbaton)

BIG-bench (Ruin Names)

MMLU (Medical Genetics)

MMLU (College Biology)

Chinchilla (few-shot, k=5)

MMLU (Professional medicine)

MMLU (Abstract Algebra)

GAL 30B (zero-shot)