HyperAI超神経

Multi Hop Question Answering On Concurrentqa

評価指標

Answer F1

評価結果

このベンチマークにおける各モデルのパフォーマンス結果

比較表
モデル名Answer F1
reasoning-over-public-and-private-data-in56.5