13일 전
CICERO: 대화에서 맥락화된 일반적 지식 추론을 위한 데이터셋
Deepanway Ghosal, Siqi Shen, Navonil Majumder, Rada Mihalcea, Soujanya Poria

초록
이 논문은 맥락화된 일반지식 추론을 활용한 대화 추론 문제를 다룬다. 우리는 원인, 후속 사건, 전제 조건, 동기, 정서적 반응의 다섯 가지 유형의 발화 수준 추론을 포함하는 이원적 대화 데이터셋인 CICERO를 구축하였다. 이 데이터셋은 5,672개의 대화에서 도출된 총 53,105건의 추론을 포함하고 있다. 본 연구에서는 이 데이터셋을 활용하여 관련 생성형 및 판별형 과제를 해결한다. 구체적으로는 원인 및 후속 사건의 생성, 전제 조건, 동기 및 청취자의 정서적 반응의 생성, 그리고 타당한 대안 선택을 수행한다. 실험 결과는 이러한 대화 중심의 일반지식 기반 데이터셋의 가치를 입증한다. 우리는 CICERO가 일반지식 기반 대화 추론 분야에 새로운 연구 방향을 열어줄 것을 기대한다.