HyperAIHyperAI
منذ 7 أيام

CATs++: تعزيز تجميع التكاليف باستخدام التحويلات والمحولات

Seokju Cho, Sunghwan Hong, Seungryong Kim
CATs++: تعزيز تجميع التكاليف باستخدام التحويلات والمحولات
الملخص

تُعد عملية تجميع التكاليف (Cost Aggregation) عملية بالغة الأهمية في مهام مطابقة الصور، والتي تهدف إلى تفادي التباس القيم المطابقة الضوضائية. تتناول الطرق الحالية هذه المشكلة عادةً باستخدام طرق مصممة يدويًا أو تعتمد على الشبكات العصبية التلافيفية (CNN)، حيث تفتقر الأولى إلى المرونة تجاه التشوهات الشديدة، بينما تُرَكِّز الثانية على قيود الشبكات العصبية التلافيفية التي تفشل في التمييز بين المطابقات الخاطئة بسبب حدود مجال الاستقبال المحدودة وعدم مرونتها. في هذا البحث، نقدم طريقة تُسمى تجميع التكاليف باستخدام المحولات (CATs) لمعالجة هذه المشكلة من خلال استكشاف التوافق العالمي بين خريطة الترابط الأولية، وذلك بفضل تصميمات معمارية تتيح لنا الاستفادة الكاملة من مجال الاستقبال العالمي الخاص بآلية الانتباه الذاتي. علاوةً على ذلك، لتسهيل بعض القيود التي قد تواجهها CATs، مثل التكاليف الحسابية العالية الناتجة عن استخدام المحول القياسي الذي تتزايد تعقيده مع حجم الأبعاد المكانية والسمات، ما يُحد من تطبيقها على دقة محدودة ويؤدي إلى أداء محدود نسبيًا، نقترح نسخة مُطورة تُسمى CATs++، وهي توسعة لطريقة CATs. تتفوق الطرق المقترحة على أحدث الطرق السابقة بفارق كبير، وتُحدِّد حالة جديدة للذروة في الأداء على جميع المعايير، بما في ذلك PF-WILLOW وPF-PASCAL وSPair-71k. ونقدم أيضًا دراسات تحليلية واسعة وتحليلات متعمقة.

CATs++: تعزيز تجميع التكاليف باستخدام التحويلات والمحولات | أحدث الأوراق البحثية | HyperAI