HyperAIHyperAI

Command Palette

Search for a command to run...

LoReTrack: تتبع كفاءة ودقة منخفضة الدقة باستخدام التحويلات

Shaohua Dong Yunhe Feng Qing Yang Yuewei Lin Heng Fan

الملخص

أظهرت مُتابِعات الترانسفورمر ذات الأداء العالي نتائجًا ممتازة، ومع ذلك غالبًا ما تحمل عبء حسابي ثقيل. وقد لوحظ أن إدخالًا أصغر يمكنه تقليل الحسابات فورًا وبسهولة دون تغيير النموذج، وبالتالي فإن الحل السهل هو استخدام الإدخال منخفض الدقة لمتابعة الترانسفورمر بكفاءة. رغم أنه أسرع، إلا أن هذا يضر بدقة المتابعة بشكل كبير بسبب فقدان المعلومات في المتابعة منخفضة الدقة. في هذه الورقة البحثية، نهدف إلى تخفيف هذا فقدان المعلومات لتعزيز أداء متابعة الترانسفورمر منخفضة الدقة عبر تقنية التقطير المعرفي الثنائية من مُتابِع الترانسفورمر ذي الدقة العالية (ولكن ليس الأكبر) والمجمد. يتمركز الأمر في وحدتين بسيطتين ولكنهما فعالين للتقطير المعرفي، وهما: تقطير المعرفة بين الاستعلامات والمساهمات والقيم (QKV-KD) وتقطير المعرفة التمييزية (Disc-KD)، عبر مختلف مستويات الدقة. يسمح الأول، من وجهة النظر العالمية، لمُتابِع الدقة المنخفضة بالاستفادة من الخصائص والتفاعلات التي يقدمها مُتابِع الدقة العالية، بينما يعزز الثاني، من وجهة النظر المستهدفة، قدرة تمييز الهدف عن الخلفية عبر تقليد المناطق التمييزية من نظيره ذو الدقة العالية. بفضل تقنية التقطير المعرفي الثنائية، يستمتع مُتابِعنا للترانسفورمر ذو الدقة المنخفضة (LoReTrack) ليس فقط بكفاءة عالية نتيجة لتقليل الحسابات بل أيضًا بدقة متزايدة بفضل استخلاص المعرفة من مُتابِع الدقة العالية. وفي التجارب الواسعة النطاق، حقق LoReTrack بدقة 256x256 تحسينًا ثابتًا على الأساسيات ذات نفس الدقة وأظهر نتائجًا تنافسية أو حتى أفضل مقارنة بمُتابِع الترانسفورمر ذو الدقة العالية 384x384، مع تشغيله بنسبة 52% أسرع وحفظه 56% من العمليات الحسابية (MACs). بالإضافة إلى ذلك، فإن LoReTrack قابل للتوسع حسب مستوى الدقة. عند استخدام دقة 128x128، يعمل بمعدل 25 إطارًا في الثانية على المعالج المركز (CPU) مع درجات نجاح SUC تبلغ 64.9%/46.4% على LaSOT/LaSOText، مما يجعله يتفوق على جميع مُتابِعي الوقت الحقيقي الآخرين الذين يعملون على المعالج المركز. سيتم إطلاق الكود.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp