Command Palette
Search for a command to run...
تصنيف سريع للصور بدون تدريب مسبق
تصنيف سريع للصور بدون تدريب مسبق
Zhang Yang Gong Boqing Shah Mubarak
الملخص
تُظهر تجارب التماثل الكلمي الشهيرة أن المتجهات الكلمية الحديثة تُمكّن من التقاط التنظيمات اللغوية الدقيقة في الكلمات من خلال التمايز المتجهي الخطي، ولكن من غير الواضح إلى أي مدى يمكن للمتجهات المبسّطة أن تُشْرِح التنظيمات البصرية المرتبطة بالكلمات. في هذا البحث، ندرس علاقة محددة بين الصورة والكلمة من حيث الصلة. تُظهر نتائجنا أن متجهات الكلمات الخاصة بالعلامات المرتبطة بصورة معينة تُصنَّف في المقدمة مقارنة بالعلامات غير المرتبطة، وذلك على طول الاتجاه الرئيسي في فضاء متجهات الكلمات. مستوحين من هذه الملاحظة، نقترح حلّ مسألة تسمية الصور من خلال تقدير الاتجاه الرئيسي المُميّز لكل صورة. وبشكل خاص، نستفيد من التحويلات الخطية والشبكات العصبية العميقة غير الخطية لتقريب الاتجاه الرئيسي من الصورة المدخلة. ونتيجة لذلك، نصل إلى نموذج تسمية مرن للغاية. إذ يُنفّذ بسرعة عند معالجة صورة تجريبية، وبوقت ثابت بالنسبة لحجم مجموعة التدريب. ولا يُظهر هذا النموذج أداءً متفوّقًا فقط في مسألة التسمية التقليدية على مجموعة بيانات NUS-WIDE، بل يتفوّق أيضًا على النماذج التنافسية في تسمية الصور باستخدام علامات لم تُرَ من قبل.