HyperAIHyperAI

Command Palette

Search for a command to run...

كشف الخطوط من الطرف إلى الطرف باستخدام محول واحد إلى عدة

Kunyang Zhou Rui Zhou

الملخص

على الرغم من الأداء المبهر الذي أظهرته طرق كشف المسارات في السيناريوهات الواقعية، فإن معظم هذه الطرق تتطلب معالجة ما بعدية ليست كافية المتانة. ولهذا السبب، تم تقديم كاشفات النهاية-إلى-النهاية مثل DETR (DetecTion TRansformer) في مجال كشف المسارات. ومع ذلك، فإن تعيين التسمية واحد-إلى-واحد في DETR يُضعف كفاءة التدريب بسبب تعارضات المعنى في التسميات. علاوة على ذلك، فإن الاستعلام المكاني في DETR لا يمكنه توفير سبق مكاني صريح، مما يجعل من الصعب تحسينه. في هذا البحث، نقدّم نموذج O2SFormer (Transformer واحد-إلى-عدة). نقترح أولًا تعيين التسمية واحد-إلى-عدة، الذي يدمج بين تعيين واحد-إلى-كثير وواحد-إلى-واحد لحل مشكلة تعارضات المعنى في التسميات مع الحفاظ على الكشف من النهاية إلى النهاية. وللتغلب على الصعوبة في تحسين تعيين واحد-إلى-واحد، نقترح كذلك الاستعلام التسمية الناعمة الطبقية، الذي يضبط ديناميكيًا وزن العناصر الإيجابية للمسارات الإيجابية في طبقات المُفكك المختلفة. وأخيرًا، نصمم استعلامًا مكانيًا مبنيًا على مسارات مُحددة ديناميكيًا، لاستكشاف السبق المكاني من خلال دمج مسارات المُحددات في الاستعلام المكاني. أظهرت النتائج التجريبية أن O2SFormer باستخدام هيكل ResNet50 يحقق درجة F1 قدرها 77.83% على مجموعة بيانات CULane، متفوّقًا على جميع الكاشفات القائمة على Transformer والكاشفات القائمة على CNN. علاوة على ذلك، فإن O2SFormer يُقارب 12.5 مرة أسرع من DETR عند استخدام هيكل ResNet18.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp