HyperAIHyperAI
منذ 2 أشهر

الجمع المتكامل للخصائص والتكلفة باستخدام الترانسفورمرز للاستجابة الكثيفة

Hong, Sunghwan ; Cho, Seokju ; Kim, Seungryong ; Lin, Stephen
الجمع المتكامل للخصائص والتكلفة باستخدام الترانسفورمرز للاستجابة الكثيفة
الملخص

نقدم معمارية جديدة للمراسلات الكثيفة. الطرق الأكثر تقدماً حاليًا هي طرق تستند إلى تحويلات (Transformers) وتركز إما على وصفات الميزات أو تجميع الحجم التكلفة. ومع ذلك، فإنها عادة ما تجمع واحدة منهما وليس كليهما، رغم أن التجميع المشترك سيعزز كل منهما عن طريق توفير المعلومات التي يمتلكها أحدهما ولكن يفتقر إليها الآخر، أي المعلومات الهيكلية أو الدلالية لصورة ما، أو درجة التشابه البكسلية. في هذا العمل، نقترح شبكة جديدة تستند إلى تحويلات (Transformers) تربط بين هذين الشكلين من التجميع بطريقة تستفيد من المعلومات المكملة لهما. بوجه خاص، نصمم طبقة انتباه ذاتي (self-attention) تعتمد على الوصفة لحل الغموض في الحجم التكلفة الضوضائي وتستخدم أيضًا الحجم التكلفة لتجميع الميزات بطريقة تعزز الدقة في التطابق. تقوم طبقة انتباه متقاطع (cross-attention) لاحقة بالperforming additional aggregation مشروطة بوصفات الصورتين ومدعومة بالخرج المتراكم من الطبقات السابقة. نعزز الأداء بشكل أكبر باستخدام المعالجة الهرمية، حيث توجه التجميعات على المستوى الخشن تلك على المستوى الدقيق. نقيم فعالية الطريقة المقترحة في مهام التطابق الكثيف ونحقق أداءً رائدًا في جميع المعايير الرئيسية. كما تم تقديم دراسات تقليص مفصلة لتأكيد اختيارات تصميمنا.注释:在最后一句中,“performing additional aggregation” 直接翻译为阿拉伯语可能会显得有些生硬,因此这里采用了稍微灵活的翻译方式,以保持句子的流畅性和正式性。

الجمع المتكامل للخصائص والتكلفة باستخدام الترانسفورمرز للاستجابة الكثيفة | أحدث الأوراق البحثية | HyperAI