HyperAI超神経

Question Answering On Timequestions

評価指標

P@1

評価結果

このベンチマークにおける各モデルのパフォーマンス結果

比較表
モデル名P@1
conversational-question-answering-on42.3
complex-temporal-question-answering-on56.5
openai-s-gpt4-as-coding-assistant30.6
モデル 452.9
モデル 553.6
uniqorn-unified-question-answering-over-rdf33.1
モデル 778.1
rag-based-question-answering-over75.4
explainable-conversational-question-answering52.5
time-aware-multiway-adaptive-fusion-network43.6
faithful-temporal-question-answering-over53.5
semantic-framework-based-query-generation-for53.9
モデル 1346.5
twirgcn-temporally-weighted-graph-convolution60.5
training-language-models-to-follow22.4
graphnet-graph-neural-networks-for-neutrino45.2
pullnet-open-domain-question-answering-with10.5
tempoqr-temporal-question-reasoning-over43.8
question-answering-over-temporal-knowledge39.5
llama-open-and-efficient-foundation-language-117.8
モデル 2142.4