SheetAgent: 대규모 언어 모델을 활용한 스프레드시트 추론 및 조작을 위한 전문가 에이전트

스프레드시트는 월드 와이드 웹 전반에서 널리 사용되며, 다양한 분야에서 업무 효율성을 향상시키는 중요한 역할을 하고 있습니다. 최근에는 대형 언어 모델(Large Language Model, LLM)이 자동 스프레드시트 조작에 활용되고 있지만, 추론 과제가 존재하는 복잡하고 실제적인 작업(예: 장기 조작, 다단계 추론, 모호한 요구사항 등)에서는 아직 충분히 연구되지 않았습니다. 이러한 현실적 요구사항과의 간극을 메우기 위해, 우리는 장기적이고 다중 범주를 가진 실생활 도전으로 인해 추론에 의존하는 조작을 특징으로 하는 벤치마크인 SheetRM을 소개합니다. 위의 도전 과제들을 완화하기 위해, 우리는 또한 LLM의 힘을 활용하는 새로운 자율 에이전트인 SheetAgent를 제안합니다. SheetAgent는 Planer(플래너), Informer(인포머), Retriever(리트리버)라는 세 가지 협력 모듈로 구성되어 있으며, 반복적인 작업 추론과 성찰을 통해 인간의 개입 없이 스프레드시트에서 고급 추론과 정확한 조작을 수행합니다. 광범위한 실험 결과는 SheetAgent가 기준선보다 여러 벤치마크에서 20~40%의 통과율 개선을 보여주며, 스프레드시트 조작의 정밀도를 높이고 우수한 표 추론 능력을 입증하고 있음을 시사합니다. 더 많은 세부 정보와 시각화 자료는 프로젝트 웹사이트(https://sheetagent.github.io/)에서 확인할 수 있으며, 데이터셋과 소스 코드는 https://anonymous.4open.science/r/SheetAgent에서 제공됩니다.