
초록
본 논문에서는 최신 트위터 감성 분류기를 생성하기 위해 컨벌루션 신경망(CNNs)과 장단기 기억(LSTMs) 네트워크를 사용한 시도를 설명합니다. 우리의 시스템은 라벨이 부착되지 않은 대규모 데이터를 활용하여 단어 임베딩을 사전 학습합니다. 그런 다음, 라벨이 부착되지 않은 데이터의 일부를 원격 감독을 통해 임베딩을 미세 조정(fine-tune)하는데 사용합니다. 최종적인 CNNs와 LSTMs는 임베딩이 다시 미세 조정되는 세멘트 평가(SemEval)-2017 트위터 데이터셋에서 훈련됩니다. 성능 향상을 위해 여러 개의 CNNs와 LSTMs를 앙상블(ensemble)로 결합했습니다. 이 접근 방식은 40개 팀 중 영어 하위 과제 5개 모두에서 1등을 차지하였습니다.