HyperAIHyperAI

Command Palette

Search for a command to run...

فك التحويل المكاني للكشف عن الكائنات الموجهة

Hongtian Yu Yunjie Tian Qixiang Ye Yunfan Liu

الملخص

لقد حققت نماذج التحويل البصري (ViTs) نجاحًا ملحوظًا في مهام الرؤية الحاسوبية. ومع ذلك، لم يتم استكشاف إمكاناتها في السيناريوهات الحساسة للدوران بشكل كامل، وقد يعود هذا التقييد إلى نقص التحويل المكاني الثابت في عملية نقل البيانات. في هذه الدراسة، نقدم منهجية جديدة تُسمى "فك التحويل المكاني" (Spatial Transform Decoupling - STD)، والتي تقدم حلًا بسيطًا وفعالًا للكشف عن الكائنات الموجهة باستخدام ViTs. تعتمد STD على بنية مكونة من كتل ViT متعددة، وتستخدم فروعًا شبكة منفصلة لتنبؤ الموضع والحجم والزاوية للإطارات المحيطة (bounding boxes)، مما يتيح استغلال إمكانات التحويل المكاني لـ ViTs بطريقة تقسيم واختزال. علاوة على ذلك، من خلال تجميع قنوات التنشيط المتسلسلة (CAMs) المحسوبة بناءً على المعاملات المُعدَّلة، تُعزز STD تدريجيًا الميزات داخل مناطق الاهتمام (RoIs)، مما يكمل آلية الانتباه الذاتي. وبلا إضافات مكثفة، تحقق STD أداءً من الطراز الرائد على مجموعات البيانات القياسية، بما في ذلك DOTA-v1.0 (82.24% mAP) وHRSC2016 (98.55% mAP)، مما يُثبت فعالية المنهجية المقترحة. يمكن الوصول إلى الكود المصدري من خلال الرابط: https://github.com/yuhongtian17/Spatial-Transform-Decoupling.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
فك التحويل المكاني للكشف عن الكائنات الموجهة | مستندات | HyperAI