Conversational Question Answering On

Execution Accuracy

Program Accuracy

평가 결과

이 벤치마크에서 각 모델의 성능 결과

			Paper Title
APOLLO	78.76	77.19	APOLLO: An Optimized Training Approach for Long-form Numerical Reasoning
FinQANet (RoBERTa-large)	68.90	68.24	ConvFinQA: Exploring the Chain of Numerical Reasoning in Conversational Finance Question Answering

0 of 2 row(s) selected.