HyperAIHyperAI

Command Palette

Search for a command to run...

تصنيف سريع للصور بدون تدريب مسبق

Zhang Yang Gong Boqing Shah Mubarak

الملخص

تُظهر تجارب التماثل الكلمي الشهيرة أن المتجهات الكلمية الحديثة تُمكّن من التقاط التنظيمات اللغوية الدقيقة في الكلمات من خلال التمايز المتجهي الخطي، ولكن من غير الواضح إلى أي مدى يمكن للمتجهات المبسّطة أن تُشْرِح التنظيمات البصرية المرتبطة بالكلمات. في هذا البحث، ندرس علاقة محددة بين الصورة والكلمة من حيث الصلة. تُظهر نتائجنا أن متجهات الكلمات الخاصة بالعلامات المرتبطة بصورة معينة تُصنَّف في المقدمة مقارنة بالعلامات غير المرتبطة، وذلك على طول الاتجاه الرئيسي في فضاء متجهات الكلمات. مستوحين من هذه الملاحظة، نقترح حلّ مسألة تسمية الصور من خلال تقدير الاتجاه الرئيسي المُميّز لكل صورة. وبشكل خاص، نستفيد من التحويلات الخطية والشبكات العصبية العميقة غير الخطية لتقريب الاتجاه الرئيسي من الصورة المدخلة. ونتيجة لذلك، نصل إلى نموذج تسمية مرن للغاية. إذ يُنفّذ بسرعة عند معالجة صورة تجريبية، وبوقت ثابت بالنسبة لحجم مجموعة التدريب. ولا يُظهر هذا النموذج أداءً متفوّقًا فقط في مسألة التسمية التقليدية على مجموعة بيانات NUS-WIDE، بل يتفوّق أيضًا على النماذج التنافسية في تسمية الصور باستخدام علامات لم تُرَ من قبل.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp