HyperAI초신경

Question Answering On Uniprotqa

평가 지표

BLEU-2
BLEU-4
MEATOR
ROUGE-1
ROUGE-2
ROUGE-L

평가 결과

이 벤치마크에서 각 모델의 성능 결과

비교 표
모델 이름BLEU-2BLEU-4MEATORROUGE-1ROUGE-2ROUGE-L
llama-2-open-foundation-and-fine-tuned-chat0.0190.0020.0520.1030.0600.009
biomedgpt-open-multimodal-generative-pre0.5710.5350.7540.7430.7590.622