HyperAI초신경

Multiple Choice Qa

벤치마크 목록

해당 작업에 관련된 모든 벤치마크 목록

mmlu-elementary-mathematics
최고 모델: Chinchilla (few-shot, k=5)

평가 지표

세부 정보 보기
mmlu-college-biology
최고 모델: Chinchilla (few-shot, k=5)

평가 지표

세부 정보 보기
mmlu-high-school-biology
최고 모델: Chinchilla (few-shot, k=5)

평가 지표

세부 정보 보기
mmlu-college-chemistry
최고 모델: Chinchilla (few-shot, k=5)

평가 지표

세부 정보 보기
mmlu-high-school-chemistry
최고 모델: Chinchilla (few-shot, k=5)

평가 지표

세부 정보 보기
mmlu-college-computer-science
최고 모델: Chinchilla (few-shot, k=5)

평가 지표

세부 정보 보기
mmlu-high-school-mathematics
최고 모델: GAL 120B (zero-shot)

평가 지표

세부 정보 보기
mmlu-electrical-engineer
최고 모델: GAL 120B (zero-shot)

평가 지표

세부 정보 보기
mmlu-formal-logic
최고 모델: Gopher (few-shot, k=5)

평가 지표

세부 정보 보기
medmcqa
최고 모델: Meditron-70B (CoT + SC)

평가 지표

세부 정보 보기
frenchmedmcqa
최고 모델: CamemBERT

평가 지표

세부 정보 보기
mmlu-anatomy
최고 모델: Med-PaLM 2 (ER)

평가 지표

세부 정보 보기
mmlu-abstract-algebra
최고 모델: GAL 30B (zero-shot)

평가 지표

세부 정보 보기
mmlu-econometrics
최고 모델: Gopher (few-shot, k=5)

평가 지표

세부 정보 보기
mmlu-high-school-computer-science
최고 모델: GAL 120B (zero-shot)

평가 지표

세부 정보 보기
mmlu-machine-learning
최고 모델: Chinchilla (few-shot, k=5)

평가 지표

세부 정보 보기
mmlu-college-mathematics
최고 모델: GAL 120B (zero-shot)

평가 지표

세부 정보 보기
mmlu-astronomy
최고 모델: Chinchilla (few-shot, k=5)

평가 지표

세부 정보 보기
indicglue-wstp-pa

평가 지표

세부 정보 보기
mmlu-college-physics

평가 지표

세부 정보 보기
mmlu-high-school-physics

평가 지표

세부 정보 보기
mmlu-high-school-statistics

평가 지표

세부 정보 보기
mmlu-clinical-knowledge

평가 지표

세부 정보 보기
mmlu-professional-medicine

평가 지표

세부 정보 보기
mmlu-college-medicine

평가 지표

세부 정보 보기
big-bench-hyperbaton

평가 지표

세부 정보 보기
big-bench-movie-recommendation

평가 지표

세부 정보 보기
big-bench-navigate

평가 지표

세부 정보 보기
big-bench-ruin-names

평가 지표

세부 정보 보기
big-bench-novel-concepts

평가 지표

세부 정보 보기
mmlu-medical-genetics

평가 지표

세부 정보 보기