AVSD 全称 The Audio Visual Scene-Aware Dialog(或 DSTC7 Track 3)是一个用于理解对话的视听数据集。数据集旨在建立系统并对输入视频的对话框产生相应。
AVSD 视听场景感知对话数据集
本站暂不支持该数据集下载,如需下载请访问上述「发布地址」进行下载(如可用)
感谢您下载 AVSD 视听场景感知对话数据集!
本站基于知识共享许可协议,为国内用户提供公开数据集高速下载,仅用于科研与学术交流。
获得数据集更新通知、下载过程发现问题、提供未引入数据集资源等,请关注公众号与我们沟通。
感谢您下载 AVSD 视听场景感知对话数据集!

相关数据集推荐
Blended Skill Talk 对话数据集
Blended Skill Talk 是一个关于对话的数据集。数据集分析功能如何融合在自然对话中,并比较不同架构和培训方案的性能,是对话代理重要的能力。一个好的开放域对话代理能够将吸引力、知识渊博和富有同情心等品质在对话中融合到一起。该数据集比较不同架构和方案的性能,从简单的模型…

Refer-YouTube-VOS 视频分割数据集
Refer-YouTube-VOS 是基于 Youtube-VOS 数据集建立的第一个视频分割数据集,即通过 video + caption 来执行分割。该数据集从视频中识别独特对象,每个目标对象被用两种方式进行了标注。

Who’s Waldo 图片描述数据集
Who’s Waldo 包含了 270k 个图片-文本对,并自动标注了提到的人名和他们相应的视觉区域之间的对齐关系。 Who’s Waldo 数据集是由 Wikimedia Commons 中免费许可的图片和描述构建的。Who’s Waldo 是一个基准数据集,用于以人为中心的视…
