HyperAI超神経

Answerability Prediction On Peerqa

評価指標

Macro F1

評価結果

このベンチマークにおける各モデルのパフォーマンス結果

比較表
モデル名Macro F1
モデル 10.4197
language-models-are-few-shot-learners0.3304
mistral-7b0.4703
the-llama-3-herd-of-models0.2881
gpt-4-technical-report-10.3087
the-llama-3-herd-of-models0.3112