HyperAI超神経

Probing Language Models On Kamel

評価指標

Average F1

評価結果

このベンチマークにおける各モデルのパフォーマンス結果

比較表
モデル名Average F1
kamel-knowledge-analysis-with-multitoken17.62