HyperAIHyperAI
منذ 2 أشهر

أي هيكل أساسي يجب استخدامه: مقارنة خاصة بال المجال الفعالة من حيث الموارد لرؤية الحاسوب

Pranav Jeevan; Amit Sethi
أي هيكل أساسي يجب استخدامه: مقارنة خاصة بال المجال الفعالة من حيث الموارد لرؤية الحاسوب
الملخص

في التطبيقات الحالية لرؤية الكمبيوتر، وخاصة تصنيف الصور، يتم استخدام الهياكل الأساسية المدربة مسبقًا على مجموعات بيانات كبيرة مثل ImageNet بشكل شائع كمستخلصات للسمات. رغم الاستخدام الواسع لهذه الشبكات العصبية التلافيفية المدربة مسبقًا (CNNs)، لا تزال هناك فجوة في فهم أداء الهياكل الأساسية ذات الكفاءة العالية من حيث الموارد عبر مجالات متنوعة وأحجام مجموعات بيانات مختلفة. قام دراستنا بتقييم منهجي لعدة هياكل أساسية خفيفة الوزن ومدربة مسبقًا تحت إعدادات تدريب ثابتة عبر مجموعة متنوعة من مجموعات البيانات، بما في ذلك الصور الطبيعية، الصور الطبية، صور المجرات، والصور الفضائية. يهدف هذا التحليل الشامل إلى المساعدة في اختيار الهيكل الأساسي الأكثر ملاءمة للمشكلة الخاصة بالباحثين في مجال تعلم الآلة، خاصة في السيناريوهات التي تتضمن مجموعات بيانات صغيرة حيث يكون تعديل الشبكة المدربة مسبقًا أمرًا حاسمًا. رغم أن الهندسات القائمة على الانتباه (attention) تكتسب شعبية متزايدة، فقد لاحظنا أنها تميل إلى الأداء السيء في مهمات التعديل المنخفض البيانات بالمقارنة مع CNNs. كما لاحظنا أن بعض هندسات CNN مثل ConvNeXt و RegNet و EfficientNet تؤدي بشكل أفضل بالمقارنة مع غيرها بثبات على مجموعة متنوعة من المجالات. توفر نتائجنا رؤى عملية حول التنازلات المتعلقة بالأداء وفعالية مختلف الهياكل الأساسية، مما يسهل اتخاذ قرارات مدروسة عند اختيار النموذج لمجموعة واسعة من مجالات رؤية الكمبيوتر. يمكن الوصول إلى كودنا هنا: https://github.com/pranavphoenix/Backbones

أي هيكل أساسي يجب استخدامه: مقارنة خاصة بال المجال الفعالة من حيث الموارد لرؤية الحاسوب | أحدث الأوراق البحثية | HyperAI