HyperAIHyperAI
منذ 16 أيام

FusionCount: عدّ الحشود بكفاءة من خلال دمج الميزات متعددة المقاييس

Yiming Ma, Victor Sanchez, Tanaya Guha
FusionCount: عدّ الحشود بكفاءة من خلال دمج الميزات متعددة المقاييس
الملخص

تتبع النماذج الحديثة لعدّ الحشود نهجًا مكوّنًا من معالج ترميز (Encoder) ومعالج تفكيك (Decoder). تُعالج الصور أولاً بواسطة المعالج الترميزي لاستخراج السمات، ثم، لمعالجة تشوهات المنظور، تُرسل خريطة السمات ذات المستوى الأعلى إلى مكونات إضافية لاستخراج سمات متعددة المقاييس، والتي تُستخدم كمدخلات للمعالج التفكيكي لإنتاج كثافة الحشود. ومع ذلك، في هذه الأساليب، تُهمل السمات المستخرجة في المراحل المبكرة من الترميز بشكل كبير، كما أن وحدات التوسيع متعددة المقاييس قادرة فقط على التقاط مدى محدود من مجالات الاستقبال، رغم التكلفة الحسابية الكبيرة المرتبطة بها. تُقدّم هذه الورقة معمارية جديدة لعدّ الحشود (FusionCount)، تقوم على دمج تكيّفي لمعظم السمات المشفرة، بدلًا من الاعتماد على مكونات إضافية لاستخراج السمات متعددة المقاييس. وبذلك، يمكنها تغطية نطاق أوسع من أحجام مجالات الاستقبال وتقليل التكلفة الحسابية. كما نقدّم أيضًا كتلة جديدة لتقليل الأقطار (Channel Reduction Block)، التي تستطيع استخراج معلومات البارزية أثناء عملية التفكيك، مما يعزز أداء النموذج بشكل إضافي. أظهرت التجارب على قاعدتي بيانات معياريّتين أن نموذجنا يحقق نتائج متقدمة في مجال التكنولوجيا مع تقليل التعقيد الحسابي.

FusionCount: عدّ الحشود بكفاءة من خلال دمج الميزات متعددة المقاييس | أحدث الأوراق البحثية | HyperAI