Atari-HEAD 全称 Atari Human Eye-Tracking and Demonstration Dataset,是受试者玩 Atari 视频游戏时肢体动作和眼球运动的集合数据集。数据从 4 名受试者、16 个游戏的175 个 15 分钟的试验视频和总共 297 …
机构: University of Texas at Austin
VizWiz 盲人视觉问答数据集
VizWiz-VQA (Visual Question Answering) 是一个盲人视觉问答的图像数据集。盲人用户使用 VizWiz 软件拍摄一张照片,并记录一个关于该照片的口头问题和该问题的 10 个众包答案。该数据集用于解决以下两个问题,一是预测一个视觉问题的答案,二是判…