ProNet: تعلم اقتراح صناديق خاصة بالكائنات لشبكات العصبي المتسلسلة

يهدف هذا البحث إلى تصنيف وتحديد مواقع الأشياء بدقة وكفاءة، دون استخدام ملاحظات الصناديق الحدودية. يعد هذا التحدي صعبًا نظرًا لظهور الأشياء في الطبيعة بمواقع عشوائية وأحجام مختلفة. في هذا البحث، نقترح هندسة تصنيف جديدة تُسمى ProNet تعتمد على الشبكات العصبية التلافيفية. تستخدم هذه الهندسة شبكات عصبية حاسوبية كفوءة لاقتراح مناطق الصور التي يرجح أن تحتوي على أشياء، وتقوم بتطبيق شبكات أكثر قوة ولكنها أبطأ على المناطق المقترحة. الوحدة الأساسية هي شبكة تلافيفية كاملة متعددة المقياس تقوم بتعيين درجات الثقة للصناديق في مواقع وأحجام مختلفة. نوضح أن مثل هذه الشبكات يمكن تدريبها بكفاءة باستخدام ملاحظات على مستوى الصورة، ويمكن ربطها في سلسلات أو أشجار لتحقيق تصنيف الأشياء بكفاءة. حققت ProNet تفوقًا كبيرًا على الطرق السابقة الأكثر تقدمًا بشكل كبير على مجموعات البيانات PASCAL VOC 2012 و MS COCO فيما يتعلق بتصنيف الأشياء والتحديد النقطي للمواقع.