التعلم الذاتي المُراقب باستخدام تعديلات البيانات يُعزل بشكل مُثبت المحتوى عن الأسلوب

أظهر التعلم التمثيلي ذاتيًا نجاحًا ملحوظًا في عدد من المجالات. إحدى الممارسات الشائعة هي إجراء تضخيم البيانات من خلال تحويلات مصممة يدويًا بقصد الحفاظ على المعاني دون تغيير. نسعى لفهم النجاح التجريبي لهذا النهج من منظور نظري. نُصِف عملية التضخيم كنموذج متغير خفي من خلال افتراض تقسيم التمثيل الخفي إلى مكون محتوى، والذي يُفترض أنه غير متغير تجاه التضخيم، ومكون نمط، والذي يُسمح له بالتغير. على عكس الدراسات السابقة في فصل المكونات وتحليل المكونات المستقلة، نسمح بوجود اعتمادات إحصائية وسببية غير تافهة في الفضاء الخفي. ندرس قابلية التمييز للتمثيل الخفي بناءً على أزواج من الرؤى للبيانات، ونُثبت شروطًا كافية تسمح لنا بتحديد مكون المحتوى الثابت حتى تطبيق تحويل عكسي في كلا النموذجين التوليدي والتمييزي. ووجدنا أن المحاكاة العددية مع متغيرات خفية مرتبطة تتماشى مع نظريتنا. وأخيرًا، نُقدّم Causal3DIdent، وهي مجموعة بيانات مكونة من صور عالية الأبعاد ومرئية معقدة، تحتوي على اعتمادات سببية غنية، والتي نستخدمها لدراسة تأثير تضخيم البيانات الذي يُطبَّق عمليًا.