日期
机构
发布地址
github.com
许可协议
其他
标签
分类
OpenViDial 是一个大规模多模态对话数据集。 OpenViDial 从影视作品中提取对话转折和视觉语境,每一个对话转折都与所发生的视觉语境相匹配。
OpenViDial 数据集总共包含 110 万个对话回合,因此有 110 万个视觉上下文存储在图像中。