
초록
자유형식 테이블에 대한 질문 응답(테이블QA)은 테이블의 유연한 구조와 복잡한 스키마 때문에 어려운 작업입니다. 최근 연구에서는 이 작업을 위해 대형 언어 모델(LLMs)을 사용하여, 자연어로 제시되는 질문과 많은 텍스트 필드를 포함하는 표 형식 데이터를 이해하는 능력을 활용하고 있습니다. 이러한 접근 방식은 유망한 결과를 보여주고 있지만, 표 형식 데이터에서 자주 나타나는 수치 값에 대한 도전 과제를 간과하고 있으며, LLMs는 이러한 수치 값 처리에서 어려움을 겪는 것으로 알려져 있습니다. 우리는 이 문제를 해결하기 위해, LLMs를 답변 생성기보다는 계획자로 사용하는 모델인 TabLaP를 제안합니다. 이 접근 방식은 LLMs의 다단계 추론 능력을 활용하면서 실제 수치 계산은 Python 인터프리터에게 맡겨 정확한 계산을 수행하게 합니다. LLMs의 부정확성 문제를 인지하고, 우리는 TabLaP가 생성한 답변의 신뢰성을 측정하는 첫 번째 시도를 하였습니다. 이를 통해 사용자는 후회 없이 TabLaP를 사용할 수 있게 되었습니다. 두 개의 벤치마크 데이터셋에서 실험한 결과, TabLaP는 최신 모델들보다 크게 더 정확하며, 두 데이터셋에서 각각 5.7%와 5.8%의 답변 정확도 향상을 보였습니다.