HyperAIHyperAI

Command Palette

Search for a command to run...

الانتباه البصري بيردج: عدسة جديدة لتعزيز تصنيف الصور

Mahmudul Hasan

الملخص

في مهام رؤية الحاسوب، يُعد القدرة على التركيز على المناطق ذات الصلة داخل الصورة أمرًا حاسمًا لتحسين أداء النموذج، خاصةً عندما تكون الميزات الأساسية صغيرة أو خفية أو موزعة مكانيًا. تتعامل الشبكات العصبية التلافيفية (CNN) عادةً مع جميع مناطق الصورة بشكل متساوٍ، مما قد يؤدي إلى استخراج ميزات غير فعّال. لمعالجة هذا التحدي، قدمتُ ميكانيكية انتباه جديدة تُسمى "Vision Eagle Attention"، التي تُحسّن استخراج الميزات البصرية باستخدام انتباه مكاني تلافيفي. يُطبّق النموذج التلافيف لاستخلاص الميزات المكانية المحلية، ويُولّد خريطة انتباه تُركّز بشكل انتقائي على المناطق الأكثر إفادة في الصورة. تمكن هذه الميكانيكية النموذج من التركيز على الميزات التمييزية مع تقليل تأثير المعلومات الخلفية غير الضرورية. وقد قمتُ بدمج ميكانيكية Vision Eagle Attention في بنية خفيفة الوزن تُسمى ResNet-18، وأظهرت أن هذا التجميع يؤدي إلى نموذج كفؤ وقوي. تم تقييم أداء النموذج المقترح على ثلاث مجموعات معيارية شائعة الاستخدام: FashionMNIST، وIntel Image Classification، وOracleMNIST، مع التركيز الأساسي على تصنيف الصور. أظهرت النتائج التجريبية تحسّنًا في دقة التصنيف. علاوةً على ذلك، يُمكن توسيع هذا الأسلوب لتطبيقات بصرية أخرى مثل كشف الكائنات، والتقسيم البصري، والتتبع البصري، مقدّمًا حلًا فعّالًا من حيث الحوسبة لطيف واسع من التطبيقات القائمة على الرؤية. يمكن الاطلاع على الكود من خلال الرابط التالي: https://github.com/MahmudulHasan11085/Vision-Eagle-Attention.git


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
الانتباه البصري بيردج: عدسة جديدة لتعزيز تصنيف الصور | مستندات | HyperAI