한 달 전

전 세계적 실체 해소에 BERT 활용

Ikuya Yamada; Koki Washio; Hiroyuki Shindo; Yuji Matsumoto
전 세계적 실체 해소에 BERT 활용
초록

우리는 BERT 기반의 전역 엔티티 해소(GED) 모델을 제안합니다. GED를 위해 전역 문맥 정보를 포착하기 위해서, 우리의 모델은 단어뿐만 아니라 엔티티도 입력 토큰으로 처리하며, 각 단계에서 언급을 참조 엔티티로 순차적으로 해결하고 해결된 엔티티를 입력으로 사용하여 작업을 수행합니다. 우리는 위키백과에서 얻은 대규모 엔티티 주석이 있는 말뭉치를 사용하여 모델을 학습시켰습니다. 우리는 AIDA-CoNLL, MSNBC, AQUAINT, ACE2004 및 WNED-WIKI라는 다섯 개의 표준 GED 데이터셋에서 새로운 최고 수준의 결과를 달성했습니다. 소스 코드와 모델 체크포인트는 https://github.com/studio-ousia/luke 에서 확인할 수 있습니다.