HyperAIHyperAI
منذ 2 أشهر

KERMIT: نموذج توليدي قائم على الإدراج للتواليات

William Chan; Nikita Kitaev; Kelvin Guu; Mitchell Stern; Jakob Uszkoreit
KERMIT: نموذج توليدي قائم على الإدراج للتواليات
الملخص

نقدم KERMIT، وهي طريقة بسيطة قائمة على الإدراج لنموذج التوليد للسلسلات وازدواج السلسلات. يُعد نموذج KERMIT توزيعًا مشتركًا وتفكيكاته (أي الحدودية والشرطية) باستخدام شبكة عصبية واحدة، وعلى عكس الكثير من الأعمال السابقة، لا يعتمد على تحليل مسبق لتوزيع البيانات. أثناء التدريب، يمكن إدخال بيانات مزدوجة $(x, y)$ إلى KERMIT لتعلم التوزيع المشترك $p(x, y)$، ويمكن اختياريًا مزج بيانات غير مزدوجة $x$ أو $y$ لتحسين الحدودية $p(x)$ أو $p(y)$. أثناء الاستدلال، لدينا إمكانية الوصول إلى الشرطيات في الاتجاهين $p(x \mid y)$ و$p(y \mid x)$. يمكننا أيضًا أخذ عينات من التوزيع المشترك أو الحدودية. يدعم النموذج كلًا من التفكيك الذاتي بالكامل والتفكيك الجزئي المتوازي، حيث يظهر الأخير زمن تشغيل متعدد اللوغاريتمات بشكل تجريبي. نثبت من خلال التجارب في الترجمة الآلية وتعلم التمثيل والإجابة على الأسئلة المغلقة بدون تعلم أولي أن نهجنا الموحد قادر على تحقيق أو تجاوز أداء الأنظمة الرائدة المخصصة لنطاق واسع من المهام دون الحاجة إلى تعديل هندسي خاص بالمشكلة.