HyperAIHyperAI
منذ شهر واحد

Res2Net: هندسة ظهرية متعددة المقاييس جديدة

Shang-Hua Gao; Ming-Ming Cheng; Kai Zhao; Xin-Yu Zhang; Ming-Hsuan Yang; Philip Torr
Res2Net: هندسة ظهرية متعددة المقاييس جديدة
الملخص

تمثيل الخصائص على نطاقات متعددة يُعد من أهمية بالغة لمهام الرؤية العديدة. وقد أظهرت التطورات الحديثة في شبكات النيورونات المتلافهة الأساسية (CNNs) قدرة متزايدة على تمثيل الخصائص متعددة النطاقات، مما أدى إلى تحسين الأداء بشكل متسق في مجموعة واسعة من التطبيقات. ومع ذلك، فإن معظم الأساليب الحالية تقوم بتمثيل الخصائص متعددة النطاقات بطريقة طبقية. في هذا البحث، نقترح بنية جديدة لـ CNNs تُسمى Res2Net، وذلك من خلال بناء اتصالات شبه باقية هرمية داخل كتلة باقية واحدة. يقوم Res2Net بتمثيل الخصائص متعددة النطاقات على مستوى حبيبي وزيادة نطاق المجال المرئي لكل طبقة في الشبكة. يمكن دمج الكتلة المقترحة Res2Net في نماذج CNN الأساسية الأكثر تقدمًا، مثل ResNet وResNeXt وDLA. قدمنا تقييمًا للكتلة Res2Net على جميع هذه النماذج وأظهرنا تحسينات متسقة في الأداء مقارنة بالنماذج الأساسية على مجموعات البيانات المستخدمة بشكل واسع، مثل CIFAR-100 وImageNet. كما أن دراسات الإلغاء الإضافية والنتائج التجريبية لمهام الرؤية الحاسوبية الممثلة، مثل الكشف عن الأشياء، وتخطيط التنشيط الصفي، وكشف الأشياء البارزة، تؤكد مرة أخرى تفوق Res2Net على الأساليب الأساسية الأكثر تقدمًا. يمكن الحصول على الكود المصدر والنماذج المدربة من https://mmcheng.net/res2net/.

Res2Net: هندسة ظهرية متعددة المقاييس جديدة | أحدث الأوراق البحثية | HyperAI