
초록
본 연구에서는 주석이 달린 코드 검색(annotated code search)을 제안하고 연구하였습니다. 이는 자연어 쿼리를 사용하여 코드의 의도를 간략히 설명한 코드 조각을 검색하는 과정을 의미합니다. 세 개의 벤치마크 데이터셋에서 우리는 설명을 활용하여 코드 조각의 의도를 더 잘 포착할 수 있는 방법으로 코드 검색 시스템을 어떻게 개선할 수 있는지 조사하였습니다. 최근 전이 학습과 자연어 처리 분야의 발전을 바탕으로, 자연어 설명이 추가된 코드에 대한 도메인 특화 검색 모델을 생성하였습니다. 실험 결과, 본 모델은 주석이 없는 코드에서 유일하게 스니펫의 의도를 계산하려는 최신 코드 검색 방법보다 훨씬 관련성이 높은 검색 결과를 제공하며, 평균 역순위(MRR, Mean Reciprocal Rank)에서 절대적으로 최대 20.6%의 성능 향상을 보였습니다.