11일 전

자연어 사양으로부터 UML 클래스 다이어그램을 자동으로 추출하는 방향

Song Yang, Houari Sahraoui
자연어 사양으로부터 UML 클래스 다이어그램을 자동으로 추출하는 방향
초록

모델 기반 공학(MDE)에서 UML 클래스 다이어그램은 개발자 간의 계획 수립과 소통을 위한 중요한 수단으로 활용된다. 그러나 이러한 과정은 복잡하고 자원을 많이 소모한다. 본 연구에서는 자연어 소프트웨어 사양에서 UML 클래스 다이어그램을 자동으로 추출하는 방법을 제안한다. 본 방법론을 개발하기 위해 자원봉사자들의 도움을 받아 UML 클래스 다이어그램과 그에 해당하는 영문 사양을 포함하는 데이터셋을 구축하였다. 제안하는 접근법은 입력 텍스트를 문장 단위로 분할하고, 문장을 분류하며, 각 문장에서 UML 클래스 다이어그램 조각을 생성한 후, 이 조각들을 결합하여 하나의 완전한 UML 클래스 다이어그램을 구성하는 파이프라인 구조로 이루어져 있다. 또한 UML 클래스 다이어그램 추출에 특화된 정량적 테스트 프레임워크를 개발하였다. 실험 결과, 본 방법은 정밀도와 재현율 모두 낮은 성능을 보였으나, 향후 연구를 위한 기준(benchmark)으로서의 가치를 지닌다.

자연어 사양으로부터 UML 클래스 다이어그램을 자동으로 추출하는 방향 | 최신 연구 논문 | HyperAI초신경