ATF: نحو توجيه الوجه المقاوم من خلال استغلال التشابه والتنوع عبر مجموعات بيانات مختلفة
المحاذاة الوجهية هي مهمة مهمة في مجال الوسائط المتعددة. مع التقدم الملحوظ في الخوارزميات، تم إصدار العديد من مجموعات البيانات المعيارية في السنوات الأخيرة. من الناحية المُباشرة، من المُفيد دمج عدة مجموعات بيانات مُعلَّمة ذات تسميات مختلفة لتحقيق أداء أعلى في كاشف النقاط المميزة المستهدف. وعلى الرغم من الجهود الكبيرة المبذولة في الاستخدام المشترك، تظل هناك ثلاث قصور في الدراسات الحديثة، مثل التكاليف الحسابية الإضافية، وقيود نموذج التسمية، ودعم محدود للأساليب الانحدارية. ولحل هذه المشكلات، قمنا بطرح إطار تدريب بديل جديد (ATF)، الذي يستفيد من التشابه والتنوع بين مصادر الوسائط المتعددة لبناء كاشف أكثر موثوقية. يتضمن إطارنا رئيسيًا وحدتين فرعيتين: التدريب البديل بتقسيم نسبي متناقص (ATDP)، ووظيفة الخسارة متعددة الفروع (mathcal LMB). وبشكل خاص، يُدرّب ATDP عدة مجموعات بيانات في آن واحد للاستفادة من التنوّع بينها، في حين تُستخدم LMB أزواج النقاط المتميزة المشابهة لتحديد فروع مختلفة لكل مجموعة بيانات متناظرة. أظهرت التجارب الواسعة على مجموعات بيانات متنوعة فعالية إطارنا، كما أن ATF يُعدّ مناسبًا لكل من الشبكات القائمة على الخريطة الحرارية والانحدار المباشر للإحداثيات. وبشكل خاص، بلغ الخطأ المتوسط 3.17 في تجربة على مجموعة 300W باستخدام WFLW، مما يفوق بشكل كبير الطرق الحالية. وتحقق ATF تحسينًا نسبيًا يصل إلى 9.96% في كل من الشبكة التلافيفية العادية (OCN) وشبكة HRNET. تم إتاحة الشفرة المصدرية الخاصة بنا بشكل عام عبر الرابط: https://github.com/starhiking/ATF.