
초록
대부분의 기존 문장 유사성 방법은 두 입력 문장의 유사한 부분에만 초점을 맞추고, 일반적으로 문장에 대한 단서와 의미를 제공하는 비유사한 부분을 간단히 무시합니다. 본 연구에서는 문장 내에서 어휘 의미를 분해하고 합성하여 유사성과 비유사성을 모두 고려하는 모델을 제안합니다. 이 모델은 각 단어를 벡터로 표현하며, 다른 문장의 모든 단어를 바탕으로 각 단어의 의미 일치 벡터를 계산합니다. 그런 다음, 각 단어 벡터는 의미 일치 벡터를 기준으로 유사 성분과 비유사 성분으로 분해됩니다. 이를 통해 두 채널 CNN 모델이 유사 성분과 비유사 성분을 합성하여 특징을 포착하도록 사용됩니다. 마지막으로, 합성된 특징 벡터를 바탕으로 유사도 점수가 추정됩니다. 실험 결과, 제안된 모델은 답변 문장 선택 작업에서 최신 수준의 성능을 보였으며, 동의어 식별 작업에서도 유사한 결과를 달성했습니다.