HyperAI

Probing Language Models On Kamel

Métriques

Average F1

Résultats

Résultats de performance de divers modèles sur ce benchmark

Tableau comparatif
Nom du modèleAverage F1
kamel-knowledge-analysis-with-multitoken17.62