11일 전

임베딩 간 거리의 성질을 통한 워드 무버 거리 및 그 변종의 가속화

Matheus Werner, Eduardo Laber
임베딩 간 거리의 성질을 통한 워드 무버 거리 및 그 변종의 가속화
초록

Kusner 등이 제안한 단어 이동 거리(Word Mover's Distance, WMD)는 단어의 임베딩을 통해 포착된 단어 간 의미적 관계를 활용하여 문서 간 거리를 측정하는 방법이다. 이 거리는 분류 작업에서 최첨단 수준의 오차율을 달성하는 등 매우 효과적인 것으로 입증되었으나, 계산 복잡도가 높아 대규모 문서 컬렉션에 적용하기에는 현실적으로 부적합하다. 이러한 문제를 해결하기 위해 WMD의 다양한 변형이 제안되었으며, 그 중에서 간단한 구조와 높은 효율성, 빠른 구현 가능성을 갖춘 관계 완화된 단어 이동 거리(Relaxed Word Mover's Distance, RWMD)가 가장 성공적인 접근 중 하나로 평가받고 있다.임베딩 간 거리의 경험적 성질에 기반한 가정을 바탕으로, 본 연구에서는 WMD와 RWMD의 계산 속도를 향상시키는 새로운 접근법을 제안한다. 10개의 데이터셋을 대상으로 수행한 실험 결과, 제안한 방법은 동일한 오차율을 유지하면서도 문서 분류 작업에서 상당한 속도 향상을 가져옴을 확인할 수 있었다.

임베딩 간 거리의 성질을 통한 워드 무버 거리 및 그 변종의 가속화 | 최신 연구 논문 | HyperAI초신경