11일 전
이질적 요인을 삼중선형 메커니즘으로 융합하여 중첩 명명된 엔터티 인식 수행
Zheng Yuan, Chuanqi Tan, Songfang Huang, Fei Huang

초록
중첩 엔티티는 구성성의 특성을 지니고 있어 여러 도메인에서 관찰되며, 이는 일반적으로 사용되는 시퀀스 레이블링 프레임워크로는 쉽게 인식되기 어렵다. 자연스러운 해결책은 이 작업을 스팬 분류 문제로 간주하는 것이다. 더 나은 스팬 표현을 학습하고 분류 성능을 향상시키기 위해서는 내부 토큰, 경계, 레이블, 그리고 관련 스팬과 같은 다양한 요소를 효과적으로 통합하는 것이 핵심이다. 이러한 이질적인 요소들을 융합하기 위해, 우리는 새로운 삼중선형 메커니즘(triaffine mechanism)을 제안한다. 이 메커니즘은 삼중선형 어텐션(triaffine attention)과 삼중선형 점수화(triaffine scoring)로 구성된다. 삼중선형 어텐션은 경계와 레이블을 쿼리로 사용하고, 내부 토큰과 관련 스팬을 키(key)와 밸류(value)로 활용하여 스팬 표현을 생성한다. 삼중선형 점수화는 경계와 스팬 표현을 상호작용시켜 분류를 수행한다. 실험 결과, 제안한 방법은 기존의 스팬 기반 방법들을 모두 상회하며, 중첩 NER 데이터셋인 GENIA와 KBP2017에서 최신 기술(SOTA) 수준의 F₁ 점수를 달성하였으며, ACE2004 및 ACE2005에서도 경쟁력 있는 성능을 보였다.