2달 전
두 사람이 할 수 있는 게임: 차별화된 질문 생성 및 답변을 통한 시각적 대화
Unnat Jain; Svetlana Lazebnik; Alexander Schwing

초록
인간의 대화는 미묘한 뉘앙스를 가진 복잡한 메커니즘입니다. 따라서 인공지능 에이전트가 유창하게 대화에 참여할 수 있도록 개발하는 것은 야심찬 목표라고 할 수 있습니다. 아직 이 목표를 달성하기까지는 멀었지만, 최근 시각적 질문 응답, 이미지 캡셔닝, 그리고 시각적 질문 생성 분야에서 이루어진 진전은 대화 시스템이 머지 않은 미래에 실현될 가능성이 있음을 보여주고 있습니다. 이를 위해 최근 새로운 데이터셋이 소개되었으며, 특히 질문 응답 분야에서 긍정적인 결과가 제시되었습니다. 본 논문에서는 답변 예측뿐만 아니라 질문 예측에도 적용할 수 있는 간단한 대칭적 차별 기준을 시연합니다. 우리는 이 방법이 메모리 네트워크 기반 방법을 포함하여 최신 기술과 비슷한 성능을 발휘함을 보여줍니다. 또한, 시각적 대화 데이터셋에서 처음으로 질문을 하는 시스템의 성능을 평가하고, 차별적 질문 생성과 질문 응답을 통해 시각적 대화를 생성하는 방법을 시연합니다.