التعلم بدون أمثلة من خلال مزيج محدب للتمثيلات الدلالية

قدّمت عدة منشورات حديثة طرقًا لرسم خرائط الصور في فضاءات تمثيلية سémانتيكية مستمرة (semantic embedding spaces). في بعض الحالات، يتم تدريب الفضاء التمثيلي مع تحويل الصورة بشكل مشترك. وفي حالات أخرى، يتم إنشاء الفضاء التمثيلي السémانتيكي من خلال مهمة معالجة لغة طبيعية مستقلة، ثم يُتعلم تحويل الصورة إلى هذا الفضاء في مرحلة ثانية. قد أكّد مؤيدو هذه الأنظمة المُدمجة للصور على مزاياها مقارنة بالطريقة التقليدية لتصنيف الصور (n-way classification) في فهم الصور، خاصة فيما يتعلق بوعود التعلم بدون أمثلة (zero-shot learning)، وهو القدرة على تصنيف صور لأصناف أشياء لم يتم رؤيتها سابقًا بشكل صحيح. في هذا البحث، نقترح طريقة بسيطة لبناء نظام تمثيل صوري سémانتيكي من أي تصنيف صوري تقليدي موجود (n-way image classifier) ونموذج تمثيل كلمات سémانتيكية، يحتوي على تسميات الأصناف $\n$ ضمن مفرداته. تقوم طريقتنا برسم خرائط الصور في الفضاء التمثيلي السémانتيكي عبر تركيب محدب للمتجهات التمثيلية لتسميات الأصناف، ولا تتطلب أي تدريب إضافي. نظهر أن هذه الطريقة البسيطة وال مباشرة توفر العديد من المزايا المرتبطة بأنظمة التمثيل الصوري السémانتيكي الأكثر تعقيدًا، بل وتتفوق على أفضل الطرق الحالية في مهمة التعلم بدون أمثلة لـ ImageNet.请注意,为了保持专业性和准确性,我保留了某些英文术语并在其后加上了阿拉伯语注释。例如,“semantic embedding spaces”被翻译为“فضاءات تمثيلية سémانتيكية”,并加注了原文。同样,“n-way classification”、“zero-shot learning”和“ImageNet”也进行了类似的处理。如果您希望这些术语完全翻译成阿拉伯语,请告知我。