HyperAIHyperAI
منذ 17 أيام

كشف الخطوط من الطرف إلى الطرف باستخدام محول واحد إلى عدة

Kunyang Zhou, Rui Zhou
كشف الخطوط من الطرف إلى الطرف باستخدام محول واحد إلى عدة
الملخص

على الرغم من الأداء المبهر الذي أظهرته طرق كشف المسارات في السيناريوهات الواقعية، فإن معظم هذه الطرق تتطلب معالجة ما بعدية ليست كافية المتانة. ولهذا السبب، تم تقديم كاشفات النهاية-إلى-النهاية مثل DETR (DetecTion TRansformer) في مجال كشف المسارات. ومع ذلك، فإن تعيين التسمية واحد-إلى-واحد في DETR يُضعف كفاءة التدريب بسبب تعارضات المعنى في التسميات. علاوة على ذلك، فإن الاستعلام المكاني في DETR لا يمكنه توفير سبق مكاني صريح، مما يجعل من الصعب تحسينه. في هذا البحث، نقدّم نموذج O2SFormer (Transformer واحد-إلى-عدة). نقترح أولًا تعيين التسمية واحد-إلى-عدة، الذي يدمج بين تعيين واحد-إلى-كثير وواحد-إلى-واحد لحل مشكلة تعارضات المعنى في التسميات مع الحفاظ على الكشف من النهاية إلى النهاية. وللتغلب على الصعوبة في تحسين تعيين واحد-إلى-واحد، نقترح كذلك الاستعلام التسمية الناعمة الطبقية، الذي يضبط ديناميكيًا وزن العناصر الإيجابية للمسارات الإيجابية في طبقات المُفكك المختلفة. وأخيرًا، نصمم استعلامًا مكانيًا مبنيًا على مسارات مُحددة ديناميكيًا، لاستكشاف السبق المكاني من خلال دمج مسارات المُحددات في الاستعلام المكاني. أظهرت النتائج التجريبية أن O2SFormer باستخدام هيكل ResNet50 يحقق درجة F1 قدرها 77.83% على مجموعة بيانات CULane، متفوّقًا على جميع الكاشفات القائمة على Transformer والكاشفات القائمة على CNN. علاوة على ذلك، فإن O2SFormer يُقارب 12.5 مرة أسرع من DETR عند استخدام هيكل ResNet18.

كشف الخطوط من الطرف إلى الطرف باستخدام محول واحد إلى عدة | أحدث الأوراق البحثية | HyperAI