HyperAIHyperAI
منذ 19 أيام

HIH: نحو تحسين التوجيه الوجهي بدقة أكبر من خلال خريطة الحرارة في خريطة الحرارة

Xing Lan, Qinghao Hu, Qiang Chen, Jian Xue, Jian Cheng
HIH: نحو تحسين التوجيه الوجهي بدقة أكبر من خلال خريطة الحرارة في خريطة الحرارة
الملخص

يتجاوز التRegression المستند إلى الخريطة الحرارية (Heatmap-based regression) النقص في المعلومات المكانية والسياقية التي تُلاحظ في الانحدار المباشر للإحداثيات، وغيّر بشكل جذري مهمة محاذاة الوجه. ومع ذلك، يعاني هذا الأسلوب من أخطاء التقطيع (quantization errors) الناتجة عن تجاهل الإحداثيات تحت البكسل أثناء إعادة تشكيل الصورة وعمليات التقليل في الشبكة. في هذه الورقة، نقوم أولًا بتحليل كمي لهذه الأخطاء على مجموعات البيانات القياسية، حيث تمثل أكثر من ثلث أخطاء التنبؤ الكلية بالنسبة للطرق الأفضل حالياً. ولحل هذه المشكلة، نقترح تمثيلًا جديدًا يُسمى "خريطة حرارية داخل خريطة حرارية" (Heatmap In Heatmap, HIH)، وطريقة تصنيف ناعم للإحداثيات (Coordinate Soft-Classification, CSC)، وهما مدمجان بشكل سلس في الشبكة الكلاسيكية من نوع "الساعة الرملية" (hourglass network). يعتمد تمثيل HIH على استخدام خرائط حرارية متداخلة لتمثيل علامة الإحداثيات بشكل مشترك: حيث تمثل خريطة حرارية تُسمى "الخريطة الصحيحة" (integer heatmap) الإحداثيات الصحيحة، بينما تمثل خريطة حرارية أخرى تُسمى "الخريطة العشرية" (decimal heatmap) الإحداثيات تحت البكسل. وتغطي نطاق الخريطة العشرية بُعد بكسل واحد في الخريطة الصحيحة المرتبطة بها. علاوةً على ذلك، نحول مسألة الانحدار للانزياح إلى مهمة تصنيف فئات (interval classification)، ويعتبر CSC موثوقية البكسل كاحتمال للفئة (الفاصل). وفي الوقت نفسه، يستفيد CSC من خسارة التوزيع (distribution loss) لاستخدام العلامات الناعمة الناتجة عن دالة التوزيع الغاوسي لتوجيه تدريب خريطة الانزياح، مما يُسهّل تعلّم توزيع انزياحات الإحداثيات. تُظهر التجارب الواسعة على مجموعات بيانات صعبة التحدي أن نموذج HIH يمكنه تحقيق نتائج من الطراز الرائد. وبشكل خاص، يحقق HIH خطأً متوسطًا مُعادلًا (NME) قدره 4.08 على مجموعة WFLW، و3.21 على مجموعة COFW، متفوقًا بشكل ملحوظ على الطرق السابقة.

HIH: نحو تحسين التوجيه الوجهي بدقة أكبر من خلال خريطة الحرارة في خريطة الحرارة | الأوراق البحثية | HyperAI