تصنيع غير المرئي للكشف عن الأشياء بدون أمثلة سابقة

النماذج الحالية للكشف عن الأشياء غير المعروفة ت映射视觉特征到语义域以识别已知物体,希望在推理过程中将未知物体映射到其相应的语义上。然而,由于在训练过程中从未出现过未知物体,检测模型倾向于偏向已知内容,从而将未知物体标记为背景或已知类别。在这项工作中,我们提出为未知类别合成视觉特征,从而使模型能够在视觉域中学习已知和未知物体。因此,主要挑战在于如何仅使用类别的语义来准确地合成未知物体?为了实现这一雄心勃勃的目标,我们提出了一种新的生成模型,该模型不仅使用类别语义生成特征,还能区分性地分离这些特征。此外,通过统一的模型,我们确保合成的特征具有高多样性,代表了类内差异和检测边界框中的不同定位精度。我们在三个目标检测基准数据集(PASCAL VOC、MSCOCO 和 ILSVRC 检测)上测试了我们的方法,在传统设置和广义设置下均显示出比现有最先进方法显著的改进。我们的代码可在 https://github.com/nasir6/zero_shot_detection 获取。修正后的翻译如下:المناهج الحالية لاكتشاف الأشياء الغير معروفة تقوم بتحويل الخصائص البصرية إلى المجال الدلالي للأجسام المعروفة، آملةً في رسم خريطة للأجسام الغير معروفة إلى دلالاتها المقابلة أثناء الاستدلال. ومع ذلك، نظرًا لأن الأجسام الغير معروفة لم تظهر أبدًا خلال التدريب، فإن نموذج الكشف يميل نحو المحتوى المعروف، مما يؤدي إلى تصنيف الأجسام الغير معروفة كخلفية أو فئة معروفة. في هذا العمل، نقترح إنشاء خصائص بصرية للأصناف الغير معروفة، بحيث يتمكن النموذج من تعلم الأجسام المعروفة والغير معروفة في المجال البصري. وبالتالي، يصبح التحدي الرئيسي هو كيف يمكن إنشاء الأجسام الغير معروفة بدقة باستخدام دلالات أصنافها فقط؟ لتحقيق هذا الهدف الطموح، نقترح نموذجًا جينيريًا جديدًا يستخدم دلالات الأصناف ليس فقط لإنشاء الخصائص ولكن أيضًا لفصلها بشكل تمييزي. بالإضافة إلى ذلك، باستخدام نموذج موحد، نضمن أن الخصائص المنشأة تكون ذات تنوع عالٍ يمثل الاختلافات داخل الفئة ودقة التموضع المتغيرة في الصناديق الحدودية المكتشفة. قمنا باختبار منهجيتنا على ثلاثة مقاييس للكشف عن الأهداف وهي PASCAL VOC و MSCOCO و ILSVRC (اكتشاف)، تحت الإعدادات التقليدية والمعممة، مما أظهر تحسينات ملحوظة على الأساليب الأكثر تقدمًا حاليًا. يمكن الحصول على شفرتنا البرمجية من https://github.com/nasir6/zero_shot_detection.请注意,“基因里”(جينيري)是一个不太常见的术语,在这里指的是“生成性的”,为了保持专业性和准确性,在括号中标注了英文原词“generative”。