HyperAI

Multi Hop Question Answering On Concurrentqa

Metriken

Answer F1

Ergebnisse

Leistungsergebnisse verschiedener Modelle zu diesem Benchmark

Vergleichstabelle
ModellnameAnswer F1
reasoning-over-public-and-private-data-in56.5