11일 전
SANDWiCH: 문맥 내 단어의 의미 해소를 위한 이웃의 의미 분석 즉석형
Guzman-Olivares, Daniel, Quijano-Sanchez, Lara, Liberatore, Federico

초록
지난 두 해 동안 생성형 대화 기반 대규모 언어 모델(LLM)의 급성장은 거의 인간 수준의 대화 및 추론 경험을 제공할 것으로 기대되는 시스템 개발을 위한 경쟁을 촉발시켰다. 그러나 최근의 연구들은 이러한 모델이 제공하는 언어 이해 능력이 여전히 제한적이며, 특히 단어의 맥락적 의미를 파악하는 데 있어 인간 수준의 성능과는 거리가 멀다고 지적하고 있다. 이는 추론의 핵심 요소 중 하나이다. 본 논문에서는 다국어 단어의 뜻을 구분하는(WSD) 간단하면서도 계산적으로 효율적인 프레임워크를 제안한다. 우리의 접근법은 그룹 대수를 활용해 개선된 BabelNet 기반의 의미 네트워크 위에서 WSD 작업을 군집 구분 분석 문제로 재정의한다. 제안한 방법론은 여러 WSD 벤치마크에서 검증되었으며, 모든 언어와 작업에 대해 새로운 최고 성능을 달성하였고, 품사별 개별 평가에서도 우수한 성과를 보였다. 특히, 자원이 제한적인 언어 환경에서도 기존 대안들보다 뚜렷이 뛰어난 성능을 발휘하면서 파라미터 수를 72% 감소시켰다.