2달 전
테이블 조각: 테이블 질문 응답에서 하위 테이블 선택을 위한 분할 정복 접근법
Wonjin Lee; Kyumin Kim; Sungjae Lee; Jihun Lee; Kwang In Kim

초록
언어 모델(LMs)을 표에 적용하는 것은 2차원 표와 언어 모델이 원래 설계된 1차원 텍스트 간의 본질적인 구조적 차이 때문에 어려움을 겪습니다. 또한, 선형화된 표를 언어 모델에 적용할 때, 자기 주의(self-attention) 계산에서 자주 제시되는 최대 토큰 길이가 큰 표에 걸쳐 분포된 맥락을 포괄적으로 이해하는 것을 어렵게 만듭니다. 이러한 도전 과제를 해결하기 위해, 우리는 PieTa (Piece of Table)라는 새로운 서브테이블 기반 질문 응답(QA) 프레임워크를 제안합니다. PieTa는 표를 더 작은 창으로 나누고, 각 창 내에서 관련 셀을 선택하며, 이 셀들을 서브테이블로 통합하는 반복 과정을 통해 작동합니다. 이 다중 해상도 접근 방식은 여러 행과 열 간의 의존성을 포착하면서 긴 맥락 입력으로 인한 제한을 피할 수 있습니다. 단순한 반복 서브테이블 연합 알고리즘으로 구현된 PieTa는 이전 서브테이블 기반 QA 접근 방식보다 개선된 성능을 보여줍니다.