HyperAI超神経

Question Answering On Pubchemqa

評価指標

BLEU-2
BLEU-4
MEATOR
ROUGE-1
ROUGE-2
ROUGE-L

評価結果

このベンチマークにおける各モデルのパフォーマンス結果

比較表
モデル名BLEU-2BLEU-4MEATORROUGE-1ROUGE-2ROUGE-L
biomedgpt-open-multimodal-generative-pre0.2340.1410.3080.3860.2060.332
llama-2-open-foundation-and-fine-tuned-chat0.0750.0090.1490.1840.0430.142