بتات مشابهة: إنشاء بيانات منفصلة باستخدام نماذج التشتت مع التوصيف الذاتي

نقدم نموذج Bit Diffusion: منهجية بسيطة وعامة لإنشاء بيانات منفصلة باستخدام نماذج تفريغ مستمرة الحالة والزمن. الفكرة الأساسية وراء منهجيتنا هي تمثيل البيانات المنفصلة أولاً كبتات ثنائية، ثم تدريب نموذج تفريغ مستمر لتمثيل هذه البتات كأعداد حقيقية، نسميها "بتات تماثلية". لتكوين العينات، يُولِّد النموذج أولاً البتات التماثلية، والتي تُخضع بعد ذلك لعملية تقييد (thresholding) للحصول على البتات التي تمثل المتغيرات المنفصلة. كما نقترح تقنيتين بسيطتين، وهما التوصيف الذاتي (Self-Conditioning) والفواصل الزمنية غير المتماثلة (Asymmetric Time Intervals)، اللتان تؤديان إلى تحسين ملحوظ في جودة العينات الناتجة. وعلى الرغم من بساطة المنهجية، فإن النموذج المُقترح يحقق أداءً قوياً في مهام توليد الصور المنفصلة وكتابة العناوين التوضيحية للصور. في مهام توليد الصور المنفصلة، نُحسّن بشكل كبير على الأداء الأفضل السابق في كلا المجموعتين: CIFAR-10 (التي تحتوي على 3000 رمز منفصل بـ 8 بت) وImageNet-64x64 (التي تحتوي على 12000 رمز منفصل بـ 8 بت)، ونتفوّق على أفضل نموذج تسلسلي (autoregressive) في كلا الجوانب: جودة العينات (حسب معيار FID) وكفاءة الأداء. أما في مهمة كتابة العناوين التوضيحية للصور على مجموعة بيانات MS-COCO، فإن منهجيتنا تحقق نتائج تنافسية مقارنة بالنماذج التسلسلية.