HyperAIHyperAI
منذ 11 أيام

الانقسام التلقائي للصور بدون إشراف

Yassine Ouali, Céline Hudelot, Myriam Tami
الانقسام التلقائي للصور بدون إشراف
الملخص

في هذه الدراسة، نقترح منهجية جديدة للتحليل التلقائي للصور تعتمد على تكبير المعلومات المتبادلة بين وجهات نظر مختلفة مُنشأة من المدخلات. مستلهمين من النماذج التوليدية ذات التسلسل العكسي التي تتنبأ بالبكسل الحالي بناءً على البكسلات السابقة بترتيب ماسح مصفوفة (raster-scan) تم إنشاؤه باستخدام التبليط المُقنَّع (masked convolutions)، نقترح استخدام ترتيبات مختلفة على المدخلات باستخدام أشكال متعددة من التبليط المُقنَّع لبناء وجهات نظر مختلفة للبيانات. بالنسبة لدخل معين، يُنتج النموذج زوجًا من التنبؤات باستخدام ترتيبين صالحين، ثم يُدرَّب لتكبير المعلومات المتبادلة بين الناتجين. يمكن أن تكون هذه النواتج إما ميزات منخفضة الأبعاد لتعلم التمثيل، أو مجموعات ناتجة تتوافق مع العلامات الدلالية للترميز التلقائي. بينما تُستخدم التبليطات المُقنَّعة أثناء التدريب، لا يتم تطبيق أي تبليط مُقنَّع أثناء الاستدلال، ونعود إلى التبليط القياسي حيث يكون النموذج قادرًا على الوصول إلى كامل المدخل. تتفوق الطريقة المقترحة على أحدث النماذج الحالية في التحليل التلقائي للصور. وهي بسيطة وسهلة التنفيذ، ويمكن توسيعها لتشمل مهام بصرية أخرى، كما يمكن دمجها بسلاسة في الطرق الحالية للتعلم التلقائي التي تتطلب وجهات نظر مختلفة للبيانات.

الانقسام التلقائي للصور بدون إشراف | أحدث الأوراق البحثية | HyperAI