HyperAIHyperAI
منذ 11 أيام

DHOG: التجميع الهرمي العميق للأجسام

Luke Nicholas Darlow, Amos Storkey
DHOG: التجميع الهرمي العميق للأجسام
الملخص

في الآونة الأخيرة، تناولت عدد من الطرق التنافسية التعلم التمثيلي غير المراقب من خلال تعظيم المعلومات التبادلية بين التمثيلات الناتجة عن التحويلات (التكبير) المطبقة على البيانات. وتم إنتاج تمثيلات تكون مستقلة عن استراتيجيات التحويل العشوائية، ويمكن استخدامها في المهام اللاحقة مثل التجميع أو التصنيف. ومع ذلك، فإن عمليات التحويل تُحافظ على العديد من الخصائص الأصلية للصورة، ما يفتح الباب أمام اختيار تمثيلات غير مثالية تعتمد على مطابقة ميزات سهلة العثور عليها في البيانات. نُظهر أن الطرق الجشعة أو المحلية لتعظيم المعلومات التبادلية (مثل التحسين بالGradient العشوائي) تُكتشف حلولًا محلية لمعيار المعلومات التبادلية؛ مما يؤدي إلى تمثيلات ليست مثالية بالقدر الكافي للمهام اللاحقة المعقدة. وسبق أن لم تُحدد أو تُعالج هذه المشكلة بشكل خاص في الدراسات السابقة. نقدّم طريقة "التجميع الهرمي العميق للأشياء" (DHOG)، التي تحسب عددًا من التمثيلات المنفصلة المختلفة للصور بترتيب هرمي، بهدف إنتاج تمثيلات تُحسّن بشكل أفضل هدف تعظيم المعلومات التبادلية. كما وجدنا أن هذه التمثيلات تتماشى بشكل أفضل مع المهمة اللاحقة المتمثلة في تجميع الصور ضمن فئات كائنية أساسية. تم اختبار DHOG على مسألة التجميع غير المراقب، وهي مهمة لاحقة طبيعية لأن التمثيل المستهدف هو تسمية منفصلة للبيانات. وحققنا نتائج جديدة في صدارة الحالة الحالية (state-of-the-art) على ثلاث معايير رئيسية دون الحاجة إلى أي معالجة مسبقة (prefiltering) أو كشف حواف سوبيل (Sobel-edge detection)، وهي خطوات ضرورية للكثير من الطرق السابقة لكي تعمل بشكل فعّال. وحققت تحسينات في الدقة بنسبة: 4.3% على CIFAR-10، و1.5% على CIFAR-100-20، و7.2% على SVHN.

DHOG: التجميع الهرمي العميق للأجسام | أحدث الأوراق البحثية | HyperAI