HyperAIHyperAI
منذ 2 أشهر

شبكة عد الأشياء بقليل من الصور مع التكيف النموذجي التكراري

Djukic, Nikola ; Lukezic, Alan ; Zavrtanik, Vitjan ; Kristan, Matej
شبكة عد الأشياء بقليل من الصور مع التكيف النموذجي التكراري
الملخص

نعتبر数少镜头计数在图像中任意语义类别的问题،仅使用少量注释示例(少镜头)或无示例(零镜头)。标准的少镜头流程包括从示例中提取外观查询并与图像特征匹配以推断物体数量。现有方法通过特征池化提取查询,这忽略了形状信息(例如,大小和长宽比),导致物体定位精度和数量估计降低。我们提出了一种具有迭代原型适应的少镜头物体计数网络(LOCA)。我们的主要贡献是一个新的物体原型提取模块,该模块迭代地将示例形状和外观信息与图像特征融合。该模块可以轻松适应零镜头场景,使LOCA能够涵盖整个少镜头计数问题的范围。LOCA在FSC147基准测试中,在单镜头和少镜头情况下,RMSE指标上比所有最近的最先进方法高出20-30%,并在零镜头场景中达到最先进水平,同时展示了更好的泛化能力。为了确保符合阿拉伯语的语言习惯和正式风格,以下是优化后的翻译:نعتبر مشكلة العد بقليل من الصور لفئات معنى عشوائية في الصورة باستخدام عدد قليل فقط من النماذج المُشَرَّحة (قليل الصور) أو بدون نماذج (صفر الصور). يتبع الأنبوب القياسي لقليل الصور استخراج الاستعلامات المرتبطة بالمظهر من النماذج وتطابقها مع خصائص الصورة للتوصل إلى تقديرات أعداد الأشياء. تتجاهل الطرق الحالية معلومات الشكل (مثل الحجم والنسب) عند استخراج الاستعلامات عن طريق تجميع الخصائص، مما يؤدي إلى انخفاض دقة تحديد موقع الأشياء وتقدير العدد. نقترح شبكة عد الأشياء بقليل من الصور ذات التكيف النموذجي التكراري (LOCA). إسهامنا الرئيسي هو وحدة استخراج النموذج الجديدة للأجسام، والتي تقوم بتجميع معلومات الشكل والمظهر من النماذج مع خصائص الصورة بشكل تكراري. يمكن تكييف الوحدة بسهولة مع سيناريوهات صفر الصور، مما يمكّن LOCA من تغطية طيف كامل من مشاكل العد بقليل من الصور. حققت LOCA أفضل النتائج مقارنة بكافة الأساليب المتقدمة حديثًا على معيار FSC147 بنسبة 20-30% في الخطأ الجذر التربيعي المتوسط (RMSE) في حالة واحدة وقليلة الصور، كما حققت أداءً متقدمًا في سيناريوهات صفر الصور وأظهرت قدرات تعميم أفضل.请注意,“数少镜头计数”被翻译为“العد بقليل من الصور”,这是为了更好地符合阿拉伯语的表达习惯。其他专业术语如“appearance queries”、“feature pooling”等也进行了相应的调整。

شبكة عد الأشياء بقليل من الصور مع التكيف النموذجي التكراري | أحدث الأوراق البحثية | HyperAI