
초록
의미 그래프(예: WordNet)는 자연어를 두 개의 구별 가능한 계층에서 정리하는 자원입니다. 로컬 수준에서는, 하위어 관계(hypernymy)와 부분-전체 관계(meronymy) 같은 동의어 집합(synsets, 의미 구성 요소) 간의 개별 관계가 그 의미를 표현하는 단어에 대한 이해를 높여줍니다. 전역적으로 보면, 전체 네트워크의 그래프 이론적 특성을 분석함으로써 인간 언어의 구조 전체에 대한 통찰을 제공합니다. 본 논문에서는 최대 마진 마르코프 그래프 모델(Max-Margin Markov Graph Models, M3GM) 프레임워크를 통해 의미 그래프의 전역적 특성과 로컬 특성을 결합합니다. M3GM은 큰 다중 관계 그래프로 확장되는 지수형 무작위 그래프 모델(Exponential Random Graph Model, ERGM)의 새로운 확장입니다. 우리는 이러한 전역적 모델링이 동의어 집합 간의 의미 관계 예측이라는 로컬 작업에서 성능 향상에 어떻게 기여하는지를 보여주며, WN18RR 데이터셋에서 새로운 최고 수준의 결과를 도출하였습니다. WN18RR 데이터셋은 '쉬운' 상호 작용 사례가 제거된 WordNet 링크 예측 문제의 어려운 버전입니다. 또한, M3GM 모델은 잘 형성된 어휘 의미 온톨로지에서 특징적인 다중 관계 패턴(multirelational motifs)을 식별할 수 있습니다.