11일 전

NormTab: LLM의 기호적 추론 성능 향상을 위한 표형 데이터 정규화

Md Mahadi Hasan Nahid, Davood Rafiei
NormTab: LLM의 기호적 추론 성능 향상을 위한 표형 데이터 정규화
초록

최근 몇 년 동안 대규모 언어 모델(Large Language Models, LLMs)은 텍스트 데이터를 해석하고 코드를 생성하는 데 뛰어난 능력을 보여주고 있다. 그러나 웹 테이블에서 흔히 발견되는 셀 값의 구조적 변동성과 일관성 부족으로 인해, 특히 기호적 추론(symbolic reasoning)이 필요한 표 형식 데이터 처리 과제에서는 성능에 한계가 있다. 본 논문에서는 웹 테이블을 정규화함으로써 LLM의 기호적 추론 성능을 향상시키는 새로운 프레임워크인 NormTab을 제안한다. 우리는 LLM을 활용하여 표 정규화를 독립적이고 단일 실행 전처리 단계로 수행함으로써, 표 형식 데이터에 대한 기호적 추론을 지원하는 방식을 탐구한다. WikiTableQuestion 및 TabFact와 같은 도전적인 웹 테이블 데이터셋을 대상으로 수행한 실험 평가 결과, NormTab을 활용할 경우 기호적 추론 성능이 크게 향상됨을 확인하였으며, 이는 LLM 기반 기호적 추론 과제의 성능 향상을 위한 웹 테이블 정규화의 중요성과 효과를 입증한다.

NormTab: LLM의 기호적 추론 성능 향상을 위한 표형 데이터 정규화 | 최신 연구 논문 | HyperAI초신경