نموذج مطابقة الترميز الذاتي لتعلم الاعتماد الدلالي على مستوى الجملة في توليد الحوار

توليد استجابات ذات معنى متماسك لا يزال تحديًا رئيسيًا في توليد المحادثات. على عكس مهام توليد النص التقليدية، فإن العلاقة بين المدخلات والاستجابات في المحادثات أكثر تعقيدًا، مما يتطلب فهمًا عميقًا للاعتمادية الدلالية على مستوى الجملة، وهي العلاقة بين المعاني الكاملة للمدخلات والمخرجات. لحل هذه المشكلة، نقترح نموذج التوافق بين الكودر التلقائي (Auto-Encoder Matching - AEM) لتعلم مثل هذه الاعتمادية. يحتوي النموذج على كودرين تلقائيين ووحدة خريطة واحدة. يقوم الكودران التلقائيان بتعلم التمثيلات الدلالية للمدخلات والاستجابات، بينما تقوم وحدة الخريطة بتعلم كيفية ربط التمثيلات على مستوى الجملة. أظهرت نتائج التجارب من خلال التقييم الآلي والتقييم البشري أن نموذجنا قادر على توليد استجابات ذات تماسك وسلاسة عالية مقارنة بالنموذج المرجعي. يمكن الوصول إلى الرمز البرمجي عبر الرابط: https://github.com/lancopku/AMM