اكتشاف النوايا الجديدة باستخدام التجميع العميق المتماثل

اكتشاف النوايا الجديدة هو مهمة حاسمة في أنظمة الحوار. ومعظم الطرق الحالية محدودة في نقل المعرفة السابقة من النوايا المعروفة إلى النوايا الجديدة. كما تواجه صعوبات في توفير إشارات مراقبة عالية الجودة لتعلم خصائص تجمع ودية لتصنيف النوايا غير المصنفة. في هذا العمل، نقترح طريقة فعالة، وهي التجميع العميق المنسق (Deep Aligned Clustering)، لاكتشاف النوايا الجديدة بمساعدة البيانات المحدودة للنوايا المعروفة. أولاً، نستفيد من بعض العينات المعروفة والمصنفة كمعرفة سابقة لتدريب النموذج بشكل أولي. ثم، نقوم بإجراء k-means لإنتاج تعيينات التجمع كتسميات وهمية. بالإضافة إلى ذلك، نقترح استراتيجية تنسيق لمعالجة مشكلة عدم اتساق التسميات أثناء تعيينات التجمع. أخيرًا، نتعلم تمثيلات النوايا تحت إشراف التسميات الوهمية المنسقة. مع عدد غير معروف من النوايا الجديدة، نتنبأ بعدد فئات النوايا عن طريق القضاء علىusters ذات الثقة المنخفضة (low-confidence intent-wise clusters). أظهرت التجارب الشاملة على مجموعتين قياسيتين من البيانات أن طرقنا أكثر متانة وتحقق تحسينات كبيرة مقارنة بالطرق الرائدة حاليًا. تم إطلاق الكود في https://github.com/thuiar/DeepAligned-Clustering.