مُحَوِّل التوزيع المُتَفَرِّق للتنبؤ البصري الكثيف

نُقدّم إطارًا بسيطًا وفعالًا وقويًا للتنبؤات البصرية الكثيفة، مستندًا إلى خط أنابيب التشتت الشرطي. يتبع نهجنا نمطًا توليديًا يُعرف بـ "الضجيج إلى الخريطة"، حيث يتم تقليل الضجيج تدريجيًا من توزيع غاوسي عشوائي، بقيادة الصورة. ويُسمّى هذا الأسلوب DDP، والذي يُعدّ امتدادًا فعّالًا لعملية إزالة الضجيج من التشتت إلى خط أنابيب الإدراك الحديث. وبلا حاجة إلى تصميم مخصص للمهمة أو تخصيص بنية، يُمكن لـ DDP التعميم بسهولة على معظم مهام التنبؤ الكثيف، مثل التصنيف الدلالي وتقدير العمق. بالإضافة إلى ذلك، يُظهر DDP خصائص جذابة مثل الاستدلال الديناميكي والوعي بالغموض، مقارنةً بالأساليب التمييزية أحادية الخطوة السابقة. نُظهر نتائج متميزة في ثلاث مهام تمثيلية، عبر ستة معايير متنوعة، حيث يحقق DDP أداءً من الدرجة الأولى أو تنافسيًا على كل مهمة، دون استخدام تقنيات مُضافة، مقارنةً بالحلول المتخصصة. على سبيل المثال: التصنيف الدلالي (83.9 mIoU على Cityscapes)، التصنيف الخرائطي في الإحداثيات الرؤية العلوية (BEV) (70.6 mIoU على nuScenes)، وتقدير العمق (0.05 REL على KITTI). نأمل أن يُسهم أسلوبنا في كونه قاعدة معيارية قوية، ويسهّل الأبحاث المستقبلية.