OCD: تعلم الإفراط في التوافق باستخدام نماذج الانتشار الشرطي

نقدم نموذجًا ديناميكيًا حيث يتم تكييف الأوزان بناءً على عينة الإدخال x ويتم تعلمها لتتوافق مع الأوزان التي سيتم الحصول عليها من خلال تعديل النموذج الأساسي على x وتصنيفه y. يتم تقريب هذه الخريطة بين عينة الإدخال وأوزان الشبكة بواسطة نموذج انتشار مزيل الضوضاء (denoising diffusion model). يركز النموذج الانتقالي الذي نستخدمه على تعديل طبقة واحدة فقط من النموذج الأساسي ويتم تكييفه بناءً على الإدخال والتنشيطات والمخرجات لهذه الطبقة. نظرًا لطبيعة النموذج الانتقائي العشوائية، فإن التحصيلات المتعددة تولد شبكات مختلفة، مما يشكل مجموعة (ensemble) يؤدي إلى تحسينات إضافية. تظهر تجاربنا مدى التطبيق الواسع للطريقة في تصنيف الصور وإعادة بناء ثلاثي الأبعاد والبيانات الجدولية وفصل الكلام ومعالجة اللغة الطبيعية. يمكن الوصول إلى شفرتنا البرمجية من خلال الرابط: https://github.com/ShaharLutatiPersonal/OCD