2달 전
번역을 문장 분류의 추가적 맥락으로 활용
Reinald Kim Amplayo; Kyungjae Lee; Jinyeong Yeo; Seung-won Hwang

초록
문장 분류 작업에서 인접한 문장과 같은 추가적인 맥락이 분류기의 정확도를 향상시킬 수 있습니다. 그러나 이러한 맥락은 영역에 따라 달라지므로, 부적절한 영역의 분류 작업에는 사용할 수 없습니다. 이에 대비하여 우리는 모든 영역에서 항상 사용할 수 있는 번역된 문장을 맥락으로 제안합니다. 우리는 단순한 번역 특성 확장이 마진 개선만을 가져올 뿐 아니라, 불정확한 번역으로 인해 노이즈가 발생하여 분류기의 성능을 저하시킬 수 있다는 것을 발견했습니다. 이를 해결하기 위해, 우리는 다중 문장 벡터를 이용하여 다른 문장 벡터를 맥락으로 활용하여 벡터 내의 노이즈를 수정하는 다중 맥락 수정 부착 모듈(Multiple Context Fixing Attachment, MCFA)을 제시합니다. 실험 결과, 우리의 방법은 기존 모델들과 비교해 경쟁력 있게 작동하며, 여러 데이터 세트에서 최고의 분류 성능을 달성하였습니다. 우리는 처음으로 번역을 영역에 구애받지 않는 맥락으로 사용하여 문장 분류를 수행하였습니다.