HyperAIHyperAI
منذ 2 أشهر

اكتشاف علامات الكائن بشكل غير مشرف كتمثيلات هيكلية

Yuting Zhang; Yijie Guo; Yixin Jin; Yijun Luo; Zhiyuan He; Honglak Lee
اكتشاف علامات الكائن بشكل غير مشرف كتمثيلات هيكلية
الملخص

يمكن للشبكات العصبية العميقة نمذجة الصور باستخدام تمثيلات خفية غنية، لكنها لا تستطيع بشكل طبيعي تصور بنية فئات الأشياء بطريقة يمكن للإنسان إدراكها. يتناول هذا البحث مشكلة تعلم بنية الأشياء في عملية نمذجة الصور دون الإشراف. نقترح صيغة الترميز الذاتي لاكتشاف المعالم كتمثيلات هيكلية واضحة. يقوم وحدة الترميز بإخراج إحداثيات المعالم، والتي يتم ضمان صحتها من خلال قيود تعكس الخصائص الضرورية للمعالم. أما وحدة الفك,则接受 المعالم كجزء من التمثيلات القابلة للتعلم في إطار قابل للاشتقاق من النهاية إلى النهاية (end-to-end differentiable framework). المعالم التي اكتشفناها لها معنى دلالي وهي أكثر تنبؤًا بالمعالم المعلمة يدويًا مقارنة بتلك التي اكتشفتها الأساليب السابقة. كما أن إحداثيات معالمنا تعد ميزات مكملة للتمثيلات المسبقة التدريب في الشبكات العصبية العميقة في تحديد السمات البصرية. بالإضافة إلى ذلك، فإن الطريقة المقترحة تخلق بشكل طبيعي واجهة غير مشرف عليها ويمكن الإدراك منها لتعديل أشكال الأشياء وفك رموز الصور ببنية قابلة للتحكم. صفحة الويب الخاصة بالمشروع هي: http://ytzhang.net/projects/lmdis-rep注释:- "end-to-end differentiable framework" 翻译为 "إطار قابل للاشتقاق من النهاية إلى النهاية",这是该术语在阿拉伯语中的通用译法。- "landmarks" 翻译为 "المعالم",这是指图像中的关键点或特征点。- "visual attributes" 翻译为 "السمات البصرية",指的是图像中可以观察到的属性。