HyperAI

Multi Hop Question Answering On Concurrentqa

Métriques

Answer F1

Résultats

Résultats de performance de divers modèles sur ce benchmark

Tableau comparatif
Nom du modèleAnswer F1
reasoning-over-public-and-private-data-in56.5