日期
机构
发布地址
workshop.colips.org
标签
视觉对话
视频描述
分类
视频处理
AVSD 全称 The Audio Visual Scene-Aware Dialog(或 DSTC7 Track 3)是一个用于理解对话的视听数据集。数据集旨在建立系统并对输入视频的对话框产生相应。