
초록
대규모 언어 모델(Large Language Models, LLMs)은 다양한 작업에서 뛰어난 능력을 보여주고 있으나, 표 형식 데이터에 대한 해석 및 추론 능력은 여전히 탐색이 부족한 영역이다. 본 연구는 이와 같은 맥락에서 세 가지 핵심 관점에서 탐구한다: 표의 구조적 변형에 대한 LLM의 견고성, 표에 대한 텍스트적 추론과 기호적 추론의 비교 분석, 그리고 다양한 추론 경로의 집계를 통한 모델 성능 향상 가능성. 연구 결과, 동일한 내용을 담고 있는 표의 구조적 변동이 존재할 경우, 특히 기호적 추론 작업에서 성능 저하가 뚜렷하게 나타나는 것을 확인하였다. 이를 바탕으로 표 구조 정규화를 위한 새로운 방법을 제안한다. 또한, 텍스트적 추론이 기호적 추론보다 약간 우수한 성능을 보였으며, 세부적인 오류 분석을 통해 각 추론 방식이 특정 작업 유형에 따라 서로 다른 강점을 보인다는 점을 발견하였다. 특히, 혼합형 자기 일관성(mix self-consistency) 메커니즘을 활용하여 텍스트적 추론과 기호적 추론 경로를 통합한 결과, WIKITABLEQUESTIONS 데이터셋에서 73.6%의 정확도를 기록하며 기존 LLM 기반 표 처리 파라다임에 비해 상당한 성능 향상을 달성하였다. 이는 현재 최고 수준(SOTA)의 성능을 달성한 것으로 평가된다.