Conversational Question Answering On

Execution Accuracy

Program Accuracy

評価結果

このベンチマークにおける各モデルのパフォーマンス結果

			Paper Title
APOLLO	78.76	77.19	APOLLO: An Optimized Training Approach for Long-form Numerical Reasoning
FinQANet (RoBERTa-large)	68.90	68.24	ConvFinQA: Exploring the Chain of Numerical Reasoning in Conversational Finance Question Answering

0 of 2 row(s) selected.