
초록
기존의 머신 러닝 기술은 텍스트 기반 분류 작업에서 인간 수준의 성능에 가깝게 나타내고 있습니다. 그러나 이모티콘, 속어, 철자 오류, 코드 믹싱 데이터 등과 같은 채팅 데이터 내의 다중 모드 노이즈는 기존의 딥러닝 솔루션들이 저조한 성능을 보이는 원인이 됩니다. 딥러닝 시스템이 이러한 공변량(covariates)을 견고하게 포착하지 못하는 능력 부족은 그들의 성능을 제한합니다. 우리는 감성 분류를 위한 텍스트 기반 방법과 딥러닝 기반 방법을 우아하게 결합하는 시스템인 NELEC: 신경망 및 어휘 조합기(Neural and Lexical Combiner)를 제안합니다. 우리의 시스템은 SemEval-2019의 '텍스트에서 맥락적 감정 탐지(Contextual Emotion Detection in Text)' 세 번째 과제의 일부로 평가되었습니다. 우리의 시스템은 베이스라인뿐만 아니라 딥러닝 모델 벤치마크보다도 유의미하게 더 나은 성능을 보였습니다. 마이크로 평균 F1 점수 0.7765를 달성하여 테스트셋 리더보드에서 3위를 차지했습니다. 우리의 코드는 https://github.com/iamgroot42/nelec 에서 확인할 수 있습니다.