HyperAI

Probing Language Models On Kamel

Metriken

Average F1

Ergebnisse

Leistungsergebnisse verschiedener Modelle zu diesem Benchmark

Vergleichstabelle
ModellnameAverage F1
kamel-knowledge-analysis-with-multitoken17.62