2달 전

SheetCopilot: 대형 언어 모델을 활용한 소프트웨어 생산성의 새로운 단계 도약

Hongxin Li; Jingran Su; Yuntao Chen; Qing Li; Zhaoxiang Zhang

초록

컴퓨터 최종 사용자들은 표 형식 데이터 처리와 프로젝트 일정 스케줄링 등의 일상적인 작업을 완료하는 데 수십억 시간을 보냈습니다. 이러한 작업 대부분은 반복적이며 오류가 발생하기 쉽지만, 대부분의 최종 사용자들은 이러한 번거로운 작업을 자동화할 기술이 부족합니다. 대형 언어 모델(LLM)의 등장으로 자연어 사용자 요청에 따라 소프트웨어를 제어하는 것이 현실적으로 가능한 목표가 되었습니다. 본 연구에서는 자연어 작업을 받아 스프레드시트를 제어하여 요구 사항을 충족시키는 SheetCopilot 에이전트를 제안합니다. 스프레드시트 소프트웨어 기능을 추상화한 원자적 행동들의 집합을 제안하며, LLM이 스프레드시트와 견고하게 상호작용할 수 있는 상태 머신 기반 작업 계획 프레임워크를 설계하였습니다. 221개의 스프레드시트 제어 작업을 포함하는 대표적인 데이터셋을 구축하고, 소프트웨어 제어 작업에서 LLM의 능력을 엄격히 벤치마킹하기 위한 완전 자동화된 평가 파이프라인을 설정하였습니다. SheetCopilot은 단일 생성 시 44.3%의 작업을 정확히 완료하였으며, 강력한 코드 생성 베이스라인보다 크게 우수한 성능을 보였습니다. 프로젝트 페이지: https://sheetcopilot.github.io/.