HyperAIHyperAI
منذ 2 أشهر

تَدْرِيب النموذج القناة الصاخبة مسبقًا للحوار الموجه نحو المهمة

Qi Liu; Lei Yu; Laura Rimell; Phil Blunsom
تَدْرِيب النموذج القناة الصاخبة مسبقًا للحوار الموجه نحو المهمة
الملخص

الترجمة إلى اللغة العربية:يُعرف التفكيك المباشر للحوار الموجه نحو المهمة بأنه يعاني من تأثير "التفسير بعيدًا" (explaining-away effect)، والذي يتمIFEST في النماذج التي تفضل الردود القصيرة والعمومية. في هذا السياق، ندّعي أن استخدام مبرهنة بايز (Bayes' theorem) لتفكيك مهمة الحوار إلى نموذجين: توزيع السياق بالنظر إلى الرد، وتوزيع الاحتمال الأولي للرد نفسه، هو أمر مفيد. هذا النهج، الذي يعد تجسيدًا للنموذج القناة الضوضائية (noisy channel model)، يخفف من تأثير "التفسير بعيدًا" ويجيز دمج النماذج المسبقة التدريب الكبيرة في الاحتمال الأولي للرد بشكل مبدئي. نقدم تجارب واسعة النطاق تُظهر أن النموذج القناة الضوضائية يفكك ردود أفضل مقارنة بالتفكيك المباشر وأن استراتيجية التدريب المسبق ذات المرحلتين، والتي تستفيد من بيانات الحوار غير المقيدة والموجهة نحو المهمة على حد سواء، تكون أفضل من النماذج التي تم تهيئتها عشوائيًا.

تَدْرِيب النموذج القناة الصاخبة مسبقًا للحوار الموجه نحو المهمة | أحدث الأوراق البحثية | HyperAI