
摘要
目标检测被认为是计算机视觉中最具挑战性的问题之一,因为它需要同时准确预测图像中对象的类别和位置。在本研究中,我们定义了一个更为困难的场景,即零样本目标检测(Zero-Shot Object Detection, ZSD),在这种情况下,某些目标对象类别的视觉训练数据不可用。我们提出了一种新颖的方法来解决这一ZSD问题,该方法结合了嵌入向量的凸组合与检测框架。为了评估ZSD方法,我们构建了一个基于Fashion-MNIST图像的简单数据集,并为Pascal VOC检测挑战提出了一个自定义的零样本分割。实验结果表明,我们的方法在ZSD任务上取得了有前景的结果。