2달 전
지식 기반에서 텍스트와 엔티티의 분산 표현 학습
Ikuya Yamada; Hiroyuki Shindo; Hideaki Takeda; Yoshiyasu Takefuji

초록
우리는 텍스트와 지식베이스(KB) 엔티티의 분산 표현을 공동으로 학습하는 신경망 모델을 설명합니다. 지식베이스 내의 텍스트가 주어지면, 제안된 모델은 해당 텍스트와 관련된 엔티티를 예측하도록 훈련시킵니다. 이 모델은 다양한 NLP 작업을 쉽게 처리할 수 있는 일반적인 설계로 구성되어 있습니다. 우리는 위키백과에서 추출한 대규모 텍스트 코퍼스와 그 엔티티 주석을 사용하여 모델을 훈련시켰습니다. 우리는 이 모델을 비지도학습과 지도학습 환경 모두 포함하는 세 가지 중요한 NLP 작업(즉, 문장 유사성, 엔티티 링킹, 그리고 사실형 질문 응답)에 대해 평가했습니다. 그 결과, 이 세 가지 작업 모두에서 최신 연구 성과를 달성하였습니다. 우리의 코드와 훈련된 모델은 추가적인 학술 연구를 위해 공개적으로 제공되고 있습니다.