HyperAIHyperAI
منذ 9 أيام

الشبكات التدفقية بايزية

Alex Graves, Rupesh Kumar Srivastava, Timothy Atkinson, Faustino Gomez
الشبكات التدفقية بايزية
الملخص

يقدم هذا البحث نماذج التدفق بايزية (BFNs)، وهي فئة جديدة من النماذج التوليدية، حيث يتم تعديل معلمات مجموعة من التوزيعات المستقلة باستخدام الاستدلال بايزيان في ضوء عينات بيانات مشوشة، ثم تُقدَّم هذه المعلمات كمدخلات لشبكة عصبية تُخرِج توزيعًا ثانٍ يعتمد على بعضه البعض. بدءًا من توزيع أولي بسيط، وتحديث التوزيعين بشكل تكراري، يُنتج عملية توليدية مشابهة للعملية العكسية في نماذج التشتت؛ ولكنها مبسطة مفاهيمياً لأنها لا تتطلب وجود عملية أمامية. تم اشتقاق دوال خسارة للزمن المستمر والزمن المنفصل للبيانات المستمرة، والمنفصلة، والمنفصلة تمامًا، إلى جانب إجراءات لإنشاء العينات. ومن الجدير بالذكر أن مدخلات الشبكة للبيانات المنفصلة تقع على المثلث الاحتمالي (probability simplex)، وبالتالي فهي قابلة للاشتقاق بشكل طبيعي، مما يمهد الطريق لتقنيات التوجيه بالدرجات (gradient-based sample guidance) وعمليات التوليد في خطوات قليلة في المجالات المنفصلة مثل نمذجة اللغة. تعتمد دالة الخسارة على تحسين ضغط البيانات دون فرض أي قيود على بنية الشبكة العصبية. وقد أظهرت تجاربنا أن نماذج BFNs تحقق نتائج تنافسية من حيث الاحتمال اللوغاريتمي في نمذجة الصور على بيانات MNIST وCIFAR-10 المُحدَّدة ديناميكيًا إلى ثنائيات، كما تتفوّق على جميع النماذج المعروفة للتوصيف المنفصل في مهمة نمذجة لغة مستواها الحرفية على بيانات text8.