HyperAIHyperAI
منذ 2 أشهر

ZoomNeXt: شبكة هرمية تعاونية موحدة للكشف عن الأشياء المموهة

Pang, Youwei ; Zhao, Xiaoqi ; Xiang, Tian-Zhu ; Zhang, Lihe ; Lu, Huchuan
ZoomNeXt: شبكة هرمية تعاونية موحدة للكشف عن الأشياء المموهة
الملخص

المحاولات الحديثة للكشف عن الأشياء المموهة (COD) تهدف إلى تقسيم الأشياء التي تندمج بصريًا مع محيطها، وهو أمر غاية في التعقيد والصعوبة في السيناريوهات الحقيقية. بالإضافة إلى التشابه الداخلي العالي بين الأشياء المموهة والمحيط، تكون هذه الأشياء غالبًا متنوعة في الحجم، ضبابية في المظهر، وحتى محجوبة بشدة. من أجل ذلك، نقترح شبكة هرمية تعاونية موحدة فعالة تحاكي سلوك الإنسان عند مشاهدة الصور والفيديوهات الغامضة، أي التكبير والتصغير.بشكل خاص، يستخدم نهجنا استراتيجية التكبير والتصغير لتعلم الدلالات متعددة القياسات المميزة باستخدام وحدات دمج القياسات المتعددة ووحدات الإدراك بتفاصيل غنية، وهي مصممة لاستكشاف جميع العلامات غير المرئية بين الأشياء المرشحة ومحيطها. يوفر التجميع متعدد الرؤوس للأخيرة أنماطًا بصرية أكثر تنوعًا. يمكن للآلية التوجيهية للأخيرة أن تنقل الفروقات بين الإطارات بشكل فعال في السيناريوهات الزمانية-المكانية وتتعطل بشكل متكيف وإنتاج نتائج صفرية لكل الإطارات الثابتة. توفر هذه الوحدات أساسًا قويًا لتحقيق بنية موحدة للكشف عن الأشياء المموهة في الصور الثابتة وفي الفيديو.بالإضافة إلى ذلك، بالنظر إلى عدم اليقين والغموض الناشئ عن النقوش غير القابلة للتمييز، نقوم ببناء نظام تنظيمي بسيط ومعقد في الوقت نفسه، وهو خسارة الوعي بعدم اليقين (uncertainty awareness loss)، لتحفيز التنبؤات ذات الثقة العالية في المناطق المرشحة. يتفوق إطارنا العملاني للغاية باستمرار على الأساليب الرائدة حاليًا في مقاييس الكشف عن الأشياء المموهة في الصور وفي الفيديو. يمكن العثور على شفرتنا البرمجية على الرابط التالي: {https://github.com/lartpang/ZoomNeXt}.

ZoomNeXt: شبكة هرمية تعاونية موحدة للكشف عن الأشياء المموهة | أحدث الأوراق البحثية | HyperAI