HyperAIHyperAI
منذ 17 أيام

الانتباه البصري بيردج: عدسة جديدة لتعزيز تصنيف الصور

Mahmudul Hasan
الانتباه البصري بيردج: عدسة جديدة لتعزيز تصنيف الصور
الملخص

في مهام رؤية الحاسوب، يُعد القدرة على التركيز على المناطق ذات الصلة داخل الصورة أمرًا حاسمًا لتحسين أداء النموذج، خاصةً عندما تكون الميزات الأساسية صغيرة أو خفية أو موزعة مكانيًا. تتعامل الشبكات العصبية التلافيفية (CNN) عادةً مع جميع مناطق الصورة بشكل متساوٍ، مما قد يؤدي إلى استخراج ميزات غير فعّال. لمعالجة هذا التحدي، قدمتُ ميكانيكية انتباه جديدة تُسمى "Vision Eagle Attention"، التي تُحسّن استخراج الميزات البصرية باستخدام انتباه مكاني تلافيفي. يُطبّق النموذج التلافيف لاستخلاص الميزات المكانية المحلية، ويُولّد خريطة انتباه تُركّز بشكل انتقائي على المناطق الأكثر إفادة في الصورة. تمكن هذه الميكانيكية النموذج من التركيز على الميزات التمييزية مع تقليل تأثير المعلومات الخلفية غير الضرورية. وقد قمتُ بدمج ميكانيكية Vision Eagle Attention في بنية خفيفة الوزن تُسمى ResNet-18، وأظهرت أن هذا التجميع يؤدي إلى نموذج كفؤ وقوي. تم تقييم أداء النموذج المقترح على ثلاث مجموعات معيارية شائعة الاستخدام: FashionMNIST، وIntel Image Classification، وOracleMNIST، مع التركيز الأساسي على تصنيف الصور. أظهرت النتائج التجريبية تحسّنًا في دقة التصنيف. علاوةً على ذلك، يُمكن توسيع هذا الأسلوب لتطبيقات بصرية أخرى مثل كشف الكائنات، والتقسيم البصري، والتتبع البصري، مقدّمًا حلًا فعّالًا من حيث الحوسبة لطيف واسع من التطبيقات القائمة على الرؤية. يمكن الاطلاع على الكود من خلال الرابط التالي: https://github.com/MahmudulHasan11085/Vision-Eagle-Attention.git

الانتباه البصري بيردج: عدسة جديدة لتعزيز تصنيف الصور | أحدث الأوراق البحثية | HyperAI