HyperAIHyperAI

Command Palette

Search for a command to run...

FusionCount: عدّ الحشود بكفاءة من خلال دمج الميزات متعددة المقاييس

Yiming Ma Victor Sanchez Tanaya Guha

الملخص

تتبع النماذج الحديثة لعدّ الحشود نهجًا مكوّنًا من معالج ترميز (Encoder) ومعالج تفكيك (Decoder). تُعالج الصور أولاً بواسطة المعالج الترميزي لاستخراج السمات، ثم، لمعالجة تشوهات المنظور، تُرسل خريطة السمات ذات المستوى الأعلى إلى مكونات إضافية لاستخراج سمات متعددة المقاييس، والتي تُستخدم كمدخلات للمعالج التفكيكي لإنتاج كثافة الحشود. ومع ذلك، في هذه الأساليب، تُهمل السمات المستخرجة في المراحل المبكرة من الترميز بشكل كبير، كما أن وحدات التوسيع متعددة المقاييس قادرة فقط على التقاط مدى محدود من مجالات الاستقبال، رغم التكلفة الحسابية الكبيرة المرتبطة بها. تُقدّم هذه الورقة معمارية جديدة لعدّ الحشود (FusionCount)، تقوم على دمج تكيّفي لمعظم السمات المشفرة، بدلًا من الاعتماد على مكونات إضافية لاستخراج السمات متعددة المقاييس. وبذلك، يمكنها تغطية نطاق أوسع من أحجام مجالات الاستقبال وتقليل التكلفة الحسابية. كما نقدّم أيضًا كتلة جديدة لتقليل الأقطار (Channel Reduction Block)، التي تستطيع استخراج معلومات البارزية أثناء عملية التفكيك، مما يعزز أداء النموذج بشكل إضافي. أظهرت التجارب على قاعدتي بيانات معياريّتين أن نموذجنا يحقق نتائج متقدمة في مجال التكنولوجيا مع تقليل التعقيد الحسابي.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp