HyperAI超神经

Grounded Situation Recognition

Grounded Situation Recognition是计算机视觉领域的一项任务,旨在生成结构化的图像摘要,描述图像中的主要活动(动词)、相关实体(名词)及其边界框定位。该任务通过精准识别和定位图像中的关键元素,为自动化场景理解、内容检索和智能监控等应用提供了重要支持。