HyperAI超神经

Open Vocabulary Action Recognition

开放词汇动作识别(Open Vocabulary Action Recognition, OVAR)是计算机视觉领域的前沿任务,旨在超越训练过程中预定义的动作集合,实现对未见过的动作的泛化能力。该任务通过在推理阶段提供文本查询的形式来识别动作(动词或动词-宾语对),无需在训练阶段具备关于这些动作的先验知识。OVAR的应用价值在于能够处理更加多样和复杂的真实场景,提升视觉系统的适应性和鲁棒性。