2달 전
다중 시점 문맥 상식 추론: 새로운 데이터셋과 작업
Siqi Shen; Deepanway Ghosal; Navonil Majumder; Henry Lim; Rada Mihalcea; Soujanya Poria

초록
상황에 따른 상식 추론은 이원 대화에서 발생하는 사건들에 대한 다양한 유형의 설명을 생성하는 작업으로, 원인, 동기, 감정 반응 등을 포함합니다. 일관되고 자명하지 않은 설명을 생성하기 위해서는 대화의 구조와 사건이 맥락에서 어떻게 기반을 두고 있는지에 대한 인식이 필요합니다. 본 연구에서는 각 상황에 따른 상식 추론 질문에 대해 원인, 후속 사건, 동기, 감정 반응 등의 설명 유형을 나타내는 여러 인간 작성 답변을 포함한 2,379개의 대화에서 8,351개의 인스턴스로 구성된 데이터셋 CICEROv2를 생성하였습니다. 우리는 CICEROv2의 추론이 다른 상황에 따른 상식 추론 데이터셋보다 더 의미적으로 다양하다는 것을 보여주었습니다. 추론 작업을 해결하기 위해 개념 노이즈 제거(concept denoising) 및 발화 정렬(utterance sorting) 등을 포함한 사전 학습 목표들을 제안하였습니다. 이러한 사전 학습 목표들은 T5-Large 모델을 하류 상황에 따른 상식 추론 작업에 적응시키는 데 효과적임을 결과가 입증해주고 있습니다.