2 个月前

基于句子的演员和动作视频分割

Kirill Gavrilyuk; Amir Ghodrati; Zhenyang Li; Cees G.M. Snoek
基于句子的演员和动作视频分割
摘要

本文致力于实现视频内容中演员及其动作的像素级分割。与现有方法不同,后者均从固定的演员和动作对词汇表中学习分割,我们则是从自然语言输入句子中推断出分割结果。这使得我们能够在同一超类别下区分细微的演员差异,识别演员和动作实例,并分割超出演员和动作词汇范围的对。我们提出了一种基于编码器-解码器架构优化用于视频的全卷积模型,以实现像素级的演员和动作分割。为了展示从句子进行演员和动作视频分割的潜力,我们在两个流行的演员和动作数据集上扩展了超过7,500条自然语言描述。实验结果表明,基于句子指导的分割质量高,模型具有良好的泛化能力,并且在传统演员和动作分割任务中优于当前最先进的方法。

基于句子的演员和动作视频分割 | 最新论文 | HyperAI超神经