HyperAI超神経

Multiple Choice Question Answering Mcqa On 25

評価指標

Accuracy

評価結果

このベンチマークにおける各モデルのパフォーマンス結果

比較表
モデル名Accuracy
towards-expert-level-medical-question92.3
towards-expert-level-medical-question95.2
biomedgpt-open-multimodal-generative-pre51.1
towards-expert-level-medical-question93.4
llama-2-open-foundation-and-fine-tuned-chat43.38
llama-2-open-foundation-and-fine-tuned-chat40.07