Multiple Choice Question Answering Mcqa On 23

Accuracy

평가 결과

이 벤치마크에서 각 모델의 성능 결과

		Paper Title
Med-PaLM 2 (ER)	88.7	Towards Expert-Level Medical Question Answering with Large Language Models
Med-PaLM 2 (CoT + SC)	88.3	Towards Expert-Level Medical Question Answering with Large Language Models
Med-PaLM 2 (5-shot)	88.3	Towards Expert-Level Medical Question Answering with Large Language Models

0 of 3 row(s) selected.