Command Palette
Search for a command to run...
RPG: 통합적이고 확장 가능한 코드베이스 생성을 위한 리포지터리 계획 그래프
RPG: 통합적이고 확장 가능한 코드베이스 생성을 위한 리포지터리 계획 그래프
Jane Luo Xin Zhang Steven Liu Jie Wu Yiming Huang Yangyu Huang Chengyu Yin
초록
대규모 언어 모델은 함수 수준 및 파일 수준의 코드 생성에서 뛰어난 성능을 발휘하지만, 완전한 저장소를 처음부터 생성하는 것은 여전히 근본적인 도전 과제로 남아 있다. 이 과정은 제안 단계와 구현 단계 모두에서 일관되고 신뢰할 수 있는 계획 수립이 필요하며, 자연어는 모호성과 과도한 설명의 특성으로 인해 복잡한 소프트웨어 구조를 정확히 표현하기에 부적합하다. 이를 해결하기 위해 우리는 제안 단계와 구현 단계의 계획을 통합하는 지속 가능한 표현 방식인 저장소 계획 그래프(Repository Planning Graph, RPG)를 제안한다. RPG는 기능, 파일 구조, 데이터 흐름, 함수 등을 하나의 그래프에 encoding함으로써 제안 및 구현 단계의 계획을 통합한다. RPG는 모호한 자연어를 대체하여 명확한 설계도를 제공함으로써 장기적인 계획 수립과 확장 가능한 저장소 생성을 가능하게 한다. RPG를 기반으로, 처음부터 저장소를 생성할 수 있는 그래프 기반 프레임워크인 ZeroRepo를 개발하였다. ZeroRepo는 세 단계로 운영된다: 그래프 구축을 위한 제안 수준의 계획 및 구현 수준의 정밀화, 이후 테스트 검증을 포함한 그래프 기반 코드 생성이다. 이 설정의 성능 평가를 위해, 실제 6개 프로젝트를 기반으로 한 1,052개의 작업을 포함하는 RepoCraft라는 벤치마크를 구축하였다. RepoCraft에서 ZeroRepo는 평균적으로 약 36,000줄의 코드(LOC)를 생성하며, 가장 강력한 기준 모델(Claude Code)보다 약 3.9배, 다른 기준 모델보다 약 64배 높은 성능을 기록하였다. 기능 커버리지율은 81.5%에 달했고, 테스트 통과율은 69.7%를 기록하여 Claude Code보다 각각 27.3, 35.8个百分点 우수했다. 추가 분석을 통해 RPG가 복잡한 종속 관계를 효과적으로 모델링하며, 거의 선형적인 확장성에 따라 점차 더 고도화된 계획 수립을 가능하게 하고, LLM이 저장소를 이해하는 능력을 향상시켜 에이전트의 위치 결정 속도를 가속화함을 확인하였다.