Described Object Detection
Described Object Detection (DOD) 是计算机视觉领域的一项高级任务,旨在基于灵活的语言参考检测图像中的所有实例。DOD 不仅涵盖了开放词汇对象检测 (OVD) 的功能,还扩展了对类别名称的灵活表达,并克服了指代表达理解 (REC) 仅能定位预存对象的局限性,从而实现更精准和广泛的对象识别与定位。该技术在图像理解和场景解析中具有重要应用价值。
Described Object Detection (DOD) 是计算机视觉领域的一项高级任务,旨在基于灵活的语言参考检测图像中的所有实例。DOD 不仅涵盖了开放词汇对象检测 (OVD) 的功能,还扩展了对类别名称的灵活表达,并克服了指代表达理解 (REC) 仅能定位预存对象的局限性,从而实现更精准和广泛的对象识别与定位。该技术在图像理解和场景解析中具有重要应用价值。