
초록
어휘 의미론에서 다양한 현상에 대한 전체 문장 분할과 분할 레이블링은 일반적으로 별도로 다루어지지만, 이 둘은 서로 상호의존적인 관계에 있다. 우리는 통합된 어휘 의미 인식 작업이 이전에 분리되어 처리되었던 주석 방식, 즉 다어휘 표현 식별/분류와 슈퍼센스 태깅을 효과적으로 통합할 수 있는 방법이라고 가정한다. STREUSLE 코퍼스를 이용해 신경망 기반의 CRF 시퀀스 태거를 학습하고, 주석의 다양한 축을 기준으로 성능을 평가하였다. 기존 작업들(_PARSEME, DiMSUM)의 레이블 세트보다 일반화된 레이블 세트를 사용함에 따라, 모델이 해당 테스트 세트로의 일반화 능력도 추가로 평가하였으며, STREUSLE 코퍼스만으로 학습함에도 불구하고 기존 모델과 비교해 유사하거나 이를 초월하는 성능을 보였다. 본 연구는 통합적이고 정확한 어휘 의미 모델링을 위한 기준 모델과 평가 지표를 제시함으로써, 이 분야의 향후 연구를 촉진하는 기반을 마련하였다.