OmniPose: إطار عمل متعدد المقاييس لتقدير وضعية الأشخاص متعددين

نُقدّم "أومنيبوز" (OmniPose)، وهي إطار عمل يعتمد على عملية واحدة وقابل للتدريب من البداية إلى النهاية، ويحقق نتائج رائدة في مجال تقدير وضعية الأشخاص متعددين. باستخدام وحدة "الشلال" (waterfall module) الجديدة، تستفيد بنية أومنيبوز من تمثيلات مميزة متعددة المقاييس، مما يعزز فعالية مستخرجات الميزات الأساسية (backbone feature extractors) دون الحاجة إلى معالجة ما بعدية. كما تدمج أومنيبوز معلومات سياقية عبر المقاييس، وتحديد مواقع المفاصل باستخدام تنظيم خريطة الحرارة الغاوسية (Gaussian heatmap modulation) في وحدة استخراج الميزات متعددة المقاييس، لتقدير وضعية الإنسان بدقة تُعدّ من أرقى المستويات الحالية. تم الحصول على التمثيلات متعددة المقاييس من خلال وحدة الشلال المحسّنة في أومنيبوز، والتي تستفيد من كفاءة التصفية التدريجية في البنية المتسلسلة (cascade architecture)، مع الحفاظ على مجالات الرؤية متعددة المقاييس المماثلة لتراكيب الهرم المكاني (spatial pyramid configurations). تُظهر نتائجنا على عدة مجموعات بيانات أن أومنيبوز، مع تحسين بنية HRNet ووحدة الشلال، يُعدّ هيكلًا قويًا وفعالًا لتقدير وضعية الأشخاص متعددين، ويحقق نتائج رائدة في هذا المجال.