AVSD 오디오-비주얼 장면 인식 대화 데이터 세트

AVSD는 The Audio Visual Scene-Aware Dialog(또는 DSTC7 Track 3)의 약자로, 대화를 이해하기 위한 시청각 데이터 세트입니다. 이 데이터 세트의 목적은 시스템을 구축하고 입력 비디오의 대화에 대한 응답을 생성하는 것입니다.
AVSD는 The Audio Visual Scene-Aware Dialog(또는 DSTC7 Track 3)의 약자로, 대화를 이해하기 위한 시청각 데이터 세트입니다. 이 데이터 세트의 목적은 시스템을 구축하고 입력 비디오의 대화에 대한 응답을 생성하는 것입니다.