17 天前

Slovo:俄语手语数据集

Alexander Kapitanov, Karina Kvanchiani, Alexander Nagaev, Elizaveta Petrova
Slovo:俄语手语数据集
摘要

手语识别任务面临的主要挑战之一,在于由于听力障碍群体与听力健全社会之间的隔阂,难以获取合适的高质量数据集。此外,各国的手语差异显著,这迫使每个国家都需要独立构建专属的数据集。本文提出了一种基于众包平台构建的俄语手语(Russian Sign Language, RSL)视频数据集——Slovo。该数据集包含20,000个全高清(FullHD)视频片段,涵盖1,000个独立的RSL手势,由194名手语使用者完成录制。本文还完整公开了从数据采集到视频标注的全流程数据构建管道,并配套提供一个演示应用。为验证该数据集的教学潜力,我们在Slovo数据集上训练并评估了多个神经网络模型。所提出的高质量数据集及预训练模型已对公众开放,可供研究与应用使用。