17일 전
TAT-QA: 금융 분야의 표형 및 텍스트 형식 콘텐츠의 하이브리드에 대한 질문 응답 벤치마크
Fengbin Zhu, Wenqiang Lei, Youcheng Huang, Chao Wang, Shuo Zhang, Jiancheng Lv, Fuli Feng, Tat-Seng Chua

초록
실제 세계에서 표형 데이터와 텍스트 데이터를 결합한 하이브리드 데이터(예: 재무 보고서)는 매우 흔하다. 그러나 기존 연구에서는 이러한 하이브리드 데이터에 대한 질문 응답(Question Answering, QA)이 거의 무시되어 왔다. 본 연구에서는 실제 재무 보고서에서 샘플을 추출하여, 표형과 텍스트 데이터를 모두 포함하는 새로운 대규모 QA 데이터셋인 TAT-QA를 구축하였다. 이 데이터셋에서는 보통 덧셈, 뺄셈, 곱셈, 나눗셈, 세기, 비교/정렬 및 그 조합과 같은 수치 추론이 답변을 도출하기 위해 요구된다. 또한, 표와 텍스트 양쪽에서 추론이 가능한 새로운 QA 모델인 TAGOP를 제안한다. TAGOP는 표에서 관련 셀과 텍스트에서 관련 구간을 시퀀스 태깅을 통해 추출하고, 이를 통해 의미를 해석한 후, 집계 연산자 집합을 활용해 심볼 기반 추론을 수행하여 최종 답변을 도출한다. TAT-QA에서의 실험 결과, TAGOP는 F1 점수 58.0%를 달성하였으며, 이는 기존 최고 성능 기준 모델 대비 11.1%의 절대적 향상이다. 그러나 이 성능은 전문가 수준의 인간 성능(90.8% F1)에 비하면 여전히 크게 뒤처져 있다. 이는 TAT-QA가 매우 도전적인 데이터셋임을 입증하며, 하이브리드 형식의 데이터를 다루는 강력한 QA 모델의 학습 및 평가를 위한 기준(benchmark)으로 활용될 수 있음을 시사한다.