2달 전

비지도 딥 구조적 의미 모델을 이용한 상식 추론

Shuohang Wang; Sheng Zhang; Yelong Shen; Xiaodong Liu; Jingjing Liu; Jianfeng Gao; Jing Jiang
비지도 딥 구조적 의미 모델을 이용한 상식 추론
초록

상식 추론은 자연어 이해의 기초를 이루는 요소입니다. 전통적인 방법들은 인간이 설계한 특징과 지식 기반에 크게 의존하지만, 우리는 비지도 학습을 통해 대량의 원시 텍스트에서 상식 지식을 학습하는 방법을 탐구합니다. 본 연구에서는 두 가지 고전적인 상식 추론 과제인 윈그라드 스키마 도전(Winograd Schema Challenges, WSC)과 대명사 해석(Pronoun Disambiguation, PDP)을 해결하기 위해 딥 구조적 의미 모델(DSSM) 프레임워크를 기반으로 하는 두 개의 신경망 모델을 제안합니다. 평가 결과, 제안된 모델들이 문장 내의 맥락 정보와 대명사와 명사 간의 공유 참조 정보를 효과적으로 포착하며, 이전 최신 접근법들보다 유의미한 개선을 이루어냈다는 것을 확인할 수 있었습니다.

비지도 딥 구조적 의미 모델을 이용한 상식 추론 | 최신 연구 논문 | HyperAI초신경