
초록
소프트웨어 로그 분석은 소프트웨어 솔루션의 건강을 유지하고 규정 준수 및 보안을 보장하는 데 도움을 줍니다. 기존의 소프트웨어 시스템은 다양한 형식으로 로그를 생성하는 이종 구성 요소로 이루어져 있습니다. 일반적인 해결 방법은 수동으로 작성된 파서를 사용하여 로그를 통합하는 것이지만, 이는 많은 노력을 필요로 합니다.대신, 우리는 머신 번역(MT)을 활용하여 파싱 작업을 자동화할 가능성에 대해 탐구합니다. 우리는 합성 아파치 로그 레코드를 생성하는 도구를 만들었으며, 이를 통해 순환 신경망 기반의 MT 모델을 훈련시켰습니다. 실제 로그에서의 모델 평가 결과, 모델이 아파치 로그 형식을 학습하고 개별 로그 레코드를 파싱할 수 있음을 확인했습니다. 실제 세계의 로그 레코드와 MT 예측 간의 중간 상대적 편집 거리는 28% 이하입니다. 따라서, 우리는 MT 접근법을 사용한 로그 파싱이 유망함을 보여주었습니다.