منذ 7 أشهر

الملخص

الماكينة الترميزية المتغيرة (VAE) هي تركيبة شائعة بين نموذج متغير عمقي وتقنية تعلم متغيرة مصاحبة. من خلال استخدام شبكة استدلال عصبية لتقريب اللاحقة (posterior) للمتغيرات المخفية في النموذج، يتمكن الـ VAE من تكوين حد أدنى فعال على احتمالية البيانات الحاشية يمكن تحسينه مباشرة عبر طرق التدرج. ومع ذلك، في الممارسة العملية، غالبًا ما يؤدي تدريب الـ VAE إلى أمثل محلّي متدنٍ يُعرف بـ "انهيار اللاحقة" حيث يتعلم النموذج تجاهل المتغير المخفي واللاحقة التقريبية تحاكي الأولية (prior). في هذا البحث، ندرس انهيار اللاحقة من وجهة نظر ديناميات التدريب. نجد أن خلال المراحل الأولى من التدريب، تفشل شبكة الاستدلال في تقريب اللاحقة الحقيقية للنموذج، وهي هدف متحرك. نتيجة لذلك، يتم تشجيع النموذج على تجاهل الترميز الخفي ويحدث انهيار اللاحقة. بناءً على هذه الملاحظة، نقترح تعديلاً بسيطًا جدًا على تدريب الـ VAE لتقليل تأخر الاستدلال: اعتمادًا على المعلومات المتبادلة الحالية بين المتغير الخفي والملاحظة، نقوم بتحسين شبكة الاستدلال بشكل عدواني قبل كل تحديث للنموذج. رغم عدم إدخال أي مكونات جديدة أو تعقيد كبير فوق VAE الأساسية، فإن نهجنا قادر على تجنب مشكلة الانهيار التي أصابت كمية كبيرة من الأعمال السابقة. عمليًا، يتفوق نهجنا على القواعد الأساسية ذات الطابع الذاتي القوي في مقاييس النص والصور من حيث احتمالية البيانات المحتجزة، وهو تنافسي مع التقنيات الأكثر تعقيدًا لتجنب الانهيار بينما يكون أسرع بكثير.

ملف PDF المصدر

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا

سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين

مدعوم بواسطة MailChimp

الملخص

Junxian He; Daniel Spokoyny; Graham Neubig; Taylor Berg-Kirkpatrick

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Junxian He; Daniel Spokoyny; Graham Neubig; Taylor Berg-Kirkpatrick

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Junxian He; Daniel Spokoyny; Graham Neubig; Taylor Berg-Kirkpatrick

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

شبكات الاستدلال المتأخرة والانهيار اللاحق في المُشغِّلات التلقائية المتغيرة

Junxian He; Daniel Spokoyny; Graham Neubig; Taylor Berg-Kirkpatrick

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

شبكات الاستدلال المتأخرة والانهيار اللاحق في المُشغِّلات التلقائية المتغيرة

Junxian He; Daniel Spokoyny; Graham Neubig; Taylor Berg-Kirkpatrick

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

شبكات الاستدلال المتأخرة والانهيار اللاحق في المُشغِّلات التلقائية المتغيرة

Junxian He; Daniel Spokoyny; Graham Neubig; Taylor Berg-Kirkpatrick

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters