HyperAI초신경

Question Answering On Pubchemqa

평가 지표

BLEU-2
BLEU-4
MEATOR
ROUGE-1
ROUGE-2
ROUGE-L

평가 결과

이 벤치마크에서 각 모델의 성능 결과

비교 표
모델 이름BLEU-2BLEU-4MEATORROUGE-1ROUGE-2ROUGE-L
biomedgpt-open-multimodal-generative-pre0.2340.1410.3080.3860.2060.332
llama-2-open-foundation-and-fine-tuned-chat0.0750.0090.1490.1840.0430.142