InferNER: 마이크로블로그에서 명명된 엔티티 인식을 위한 문장 수준 정보를 활용하는 주의 기반 모델
사용자 생성 텍스트(예: 소셜 미디어 게시물)에서 명명된 실체 인식(Named Entity Recognition, NER) 문제를 조사한다. 이 데이터 유형은 길이 제한과 문법적 일관성 부족으로 인해 특히 어려운 과제를 제공한다. 현재 최첨단 접근법들은 이러한 제약을 완화하기 위해 외부 자료(예: 지명사전, gazetteers)를 활용한다. 본 연구에서는 지명사전과 같은 외부 정보에 의존하지 않고도 최첨단 성능을 초월할 수 있는 신경망 모델을 제안한다. 제안하는 접근법은 짧은 텍스트에 대한 NER 작업에서 단어, 문자, 문장 수준의 정보를 통합적으로 활용한다. 트윗과 같은 소셜 미디어 게시물은 종종 텍스트와 관련된 이미지를 함께 포함하며, 이러한 이미지는 텍스트를 이해하는 데 보조적인 맥락을 제공할 수 있다. 따라서 본 연구는 시각 정보를 도입하고, 텍스트 및 텍스트 관련 시각적 맥락에 대해 별도로 주의(attention) 가중치 확률을 계산하는 주의 메커니즘을 제안한다. 제안된 모델은 다양한 NER 데이터셋에서 현재 최고 수준의 성능을 초월한다. WNUT 2016과 2017 데이터셋에서 각각 53.48%, 50.52%의 F1 점수를 기록하였다. 다중모달 모델을 적용한 경우, 다중모달 데이터셋에서 F1 점수 74%를 달성하며 현재 최고 수준의 성능을 넘어서는 결과를 보였다. 또한 평가 결과에 따르면, 본 모델은 뉴스 기사 데이터셋에서도 기존 최고 성능을 상회함을 확인하였으며, 이는 다양한 NER 작업에 적합함을 뒷받침하는 증거로 볼 수 있다.