
초록
딥러닝 기반의 일반적인 언어 모델은 감정 분석 및 질의응답(QA)과 같은 다양한 주요 과제에서 최첨단 성능을 달성하고 있다. 소셜 미디어와 같은 도메인의 텍스트는 자체적인 두드러진 특성을 지닌다. 도메인 관련 과제에서는 도메인 지식이 유용할 수 있다. 본 연구에서는 도메인 지식을 간단한 방법으로 획득하는 기법을 제안하고, 이를 기반으로 일반 지식과 도메인 지식을 딥 언어 모델에 통합하는 방법을 제안하여 정서 분류 성능을 향상시키는 데 목적이 있다. 트위터 데이터를 대상으로 한 실험 결과, 타겟 도메인 데이터로 미세 조정된 딥 언어 모델이 기존 최첨단 모델과 비견되는 성능을 달성한 것으로 나타났으나, 본 연구에서 추출한 도메인 지식을 활용함으로써 추가적인 성능 향상이 가능함을 확인하였다. 이는 도메인 특화 응용 분야에서 도메인 지식을 적극적으로 활용하는 것이 중요함을 시사한다.