
초록
모델 기반 공학(MDE)에서 UML 클래스 다이어그램은 개발자 간의 계획 수립과 소통을 위한 중요한 수단으로 활용된다. 그러나 이러한 과정은 복잡하고 자원을 많이 소모한다. 본 연구에서는 자연어 소프트웨어 사양에서 UML 클래스 다이어그램을 자동으로 추출하는 방법을 제안한다. 본 방법론을 개발하기 위해 자원봉사자들의 도움을 받아 UML 클래스 다이어그램과 그에 해당하는 영문 사양을 포함하는 데이터셋을 구축하였다. 제안하는 접근법은 입력 텍스트를 문장 단위로 분할하고, 문장을 분류하며, 각 문장에서 UML 클래스 다이어그램 조각을 생성한 후, 이 조각들을 결합하여 하나의 완전한 UML 클래스 다이어그램을 구성하는 파이프라인 구조로 이루어져 있다. 또한 UML 클래스 다이어그램 추출에 특화된 정량적 테스트 프레임워크를 개발하였다. 실험 결과, 본 방법은 정밀도와 재현율 모두 낮은 성능을 보였으나, 향후 연구를 위한 기준(benchmark)으로서의 가치를 지닌다.