HyperAIHyperAI

Command Palette

Search for a command to run...

الانتباه الفضائي-الدّلالي العميق للبحث الدقيق القائم على الرسم التخطيطي الصغير للصور

Yi-Zhe Song Qian Yu Jifei Song Timothy M. Hospedales Tao Xiang

الملخص

الرسومات اليدوية البشرية تتميز بقدرتها على التقاط كل من البنية المكانية للكائن البصري، فضلاً عن التفاصيل الدقيقة في مظهره. وتعتمد مهمة استرجاع الصور القائمة على الرسومات الدقيقة (FG-SBIR) بشكل مهم على هذه الخصائص الدقيقة للرسومات لتنفيذ استرجاع على مستوى المثيل للصور. ومع ذلك، فإن الرسومات اليدوية غالبًا ما تكون مبسطة للغاية ورمزية، مما يؤدي إلى انحرافات شديدة عن الصور المرشحة، وبالتالي يجعل مطابقة التفاصيل البصرية الدقيقة أمرًا صعبًا. تركز النماذج الحالية لـ FG-SBIR فقط على المطابقة الشاملة الخشنة من خلال تعلم تمثيل عميق عبر المجالات المختلفة، مع تجاهل التعبير الصريح عن التفاصيل الدقيقة وسياقها المكاني. في هذا البحث، تم اقتراح نموذج جديد عميق لـ FG-SBIR يختلف بشكل ملحوظ عن النماذج الحالية في ما يلي: (1) أنه يمتلك وعيًا مكانيًا، وذلك من خلال إدخال وحدة انتباه حساسة لموقع التفاصيل البصرية في الفضاء؛ (2) يدمج بين المعلومات الدلالية الخشنة والدقيقة من خلال بلوك دمج مبني على اتصال مُباشر (shortcut connection); و(3) يُنشئ نموذجًا للارتباط بين الميزات ويكون مقاومًا للانحرافات بين الميزات المستخرجة عبر المجالين من خلال إدخال دالة طاقة قابلة للتعلم من الدرجة العليا (HOLEF) مبنية على خوارزمية خسارة جديدة. أظهرت التجارب الواسعة أن النموذج العميق المبني على الانتباه المكاني-الدالي المُقترح يتفوق بشكل كبير على أحدث النماذج المطورة.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp