HyperAIHyperAI
منذ 2 أشهر

التعلم غير المنظور للعلامات المميزة للأجسام من خلال توليد الصور المشروطة

Tomas Jakab; Ankush Gupta; Hakan Bilen; Andrea Vedaldi
التعلم غير المنظور للعلامات المميزة للأجسام من خلال توليد الصور المشروطة
الملخص

نقترح طريقة لتعلم كاشفات المعالم المرئية للأجسام (مثل العينين والأنف في الوجه) دون أي إشراف يدوي. نعتبر هذه المشكلة على أنها مشكلة توليد صور تجمع بين مظهر الجسم كما يُرى في صورة مثال أولى، وهندسة الجسم كما يُرى في صورة مثال ثانية، حيث تختلف الصورتان بنقطة النظر و/أو تشوه الجسم. من أجل فصل المظهر عن الهندسة، نقدم زجاجة رقبة ضيقة (bottleneck) في عملية استخراج الهندسة التي تختار وتستخلص الخصائص المتعلقة بالهندسة. بالمقارنة مع مشاكل التوليد القياسي للصور، والتي غالباً ما تستخدم الشبكات المضادة التوليدية (generative adversarial networks)، فإن مهمتنا في التوليد مشروطة بالمظهر والهندسة، وبالتالي فهي أقل غموضًا بكثير، لدرجة أن اعتماد صيغة بسيطة للخسارة الإدراكية تكون كافية. نثبت أن منهجيتنا يمكنها تعلم معالم الأجسام من تشوهات الصور المصنعة أو مقاطع الفيديو، كل ذلك دون إشراف يدوي، بينما تتفوق على أفضل الكاشفات غير المشرف عليها للمعالم حاليًا. نوضح أيضًا أن طريقتنا قابلة للتطبيق على مجموعة واسعة من قواعد البيانات - الوجوه، الأشخاص، الأجسام ثلاثية الأبعاد والأرقام - دون أي تعديلات.