التحليل البُعدي المعنى غير المراقب من خلال المقارنة بين اقتراحات قناع الكائن

القدرة على تعلم تمثيلات كثيفة ذات معنى للصور دون تدريب مراقبة تمثل مشكلة مهمة في رؤية الحاسوب. ومع ذلك، وبالرغم من أهميتها، تظل هذه المشكلة غير مكتملة الاستكشاف، مع وجود بعض الاستثناءات التي نظرت في التجزئة المعنى دون تدريب على مجموعات بيانات صغيرة ومجال بصري ضيق. في هذا البحث، نقوم بأول محاولة لمعالجة هذه المشكلة على مجموعات بيانات كانت تُستخدم تقليديًا في السياق المراقب. لتحقيق ذلك، نقدم إطارًا ثنائي الخطوات يعتمد على مُقدّم متوسط المستوى مُحدَّد مسبقًا ضمن دالة تحسين تقابلية لتعلم تمثيلات البكسل. يُعد هذا تباينًا كبيرًا عن الدراسات السابقة التي اعتمدت على مهام بديلة أو تجميع منتهي. علاوةً على ذلك، نُقدّم حجة حول أهمية وجود مُقدّم يحتوي على معلومات حول الكائنات أو أجزائها، ونناقش عدة إمكانات لاستخلاص مثل هذا المُقدّم بطريقة غير مراقبة.أظهرت التقييمات التجريبية أن طريقتنا تمتلك مزايا رئيسية مقارنة بالدراسات السابقة. أولًا، يمكن تجميع تمثيلات البكسل المُتعلمة مباشرة في مجموعات معنوية باستخدام خوارزمية K-Means على مجموعة بيانات PASCAL. وفي الإطار الكامل غير المراقب، لا يوجد سابق في حل مهمة التجزئة المعنوية على هذا المعيار الصعب. ثانيًا، يمكن لتمثيلاتنا أن تتفوق على قواعد قوية عند نقلها إلى مجموعات بيانات جديدة، مثل COCO وDAVIS. الكود متاح للجميع.