2달 전

소셜 미디어 데이터에서의 다중 작업 접근법을 통한 명명된 실체 인식

Gustavo Aguilar; Suraj Maharjan; Adrian Pastor López-Monroy; Thamar Solorio
소셜 미디어 데이터에서의 다중 작업 접근법을 통한 명명된 실체 인식
초록

소셜 미디어 데이터에 대한 명명된 개체 인식은 그 본질적인 노이즈성 때문에 도전적입니다. 부적절한 문법 구조뿐만 아니라, 철자 일관성 부족과 수많은 비격식적인 약어가 포함되어 있기 때문입니다. 우리는 주요 작업인 세부 명명된 개체(NE) 분류와 함께 보다 일반적인 보조 작업인 NE 분할을 사용하여 새로운 다중 작업 접근 방식을 제안합니다. 이 다중 작업 신경망 구조는 단어와 문자 시퀀스에서 높은 차원의 특징 표현을 학습하며, 기본 품사 태그와 가제터 정보도 함께 활용합니다. 이 신경망은 특징 추출기 역할을 하여 조건부 확률장(CRF: Conditional Random Fields) 분류기에 입력을 제공합니다. 우리는 3차 노이즈 사용자 생성 텍스트 워크샵(WNUT-2017)에서 41.86%의 개체 F1 점수와 40.24%의 표면 F1 점수를 얻어 1위를 차지했습니다.

소셜 미디어 데이터에서의 다중 작업 접근법을 통한 명명된 실체 인식 | 최신 연구 논문 | HyperAI초신경