كشف النية واكتشافها من سجلات المستخدم عبر التجميع التبايني شبه المراقب العميق

كشف النية يُعد عنصراً أساسياً في أنظمة الحوار، حيث يهدف إلى تصنيف تعبير المستخدم إلى واحدة من عدة نوايا مُحددة مسبقاً. ويشترط لتطوير مؤشر نية فعّال وجود مجموعة بيانات تدريب مُعلّمة بكل النوايا الممكنة التي قد يُبديها المستخدم. ومع ذلك، حتى الخبراء المُحترفين في المجال غالبًا ما يعجزون عن التنبؤ بجميع النوايا الممكنة عند التصميم، وللتطبيقات العملية، قد يتعين استخلاص نوايا جديدة بشكل تدريجي وفوري من تعبيرات المستخدمين. وبالتالي، في أي نظام حواري واقعي، يزداد عدد النوايا مع مرور الوقت، ويجب اكتشاف نوايا جديدة من خلال تحليل التعبيرات التي لا تنتمي إلى المجموعة الحالية من النوايا. في هذه الورقة، نهدف إلى: (أ) اكتشاف التعبيرات التي تمثل نوايا معروفة من عدد كبير من العينات غير المُعلّمة، بالاعتماد على عدد قليل من العينات المُعلّمة؛ و(ب) اكتشاف نوايا جديدة غير معروفة من العينات المتبقية غير المُعلّمة. تتناول الطرق الحديثة المتطورة (SOTA) هذه المشكلة من خلال التعلم التمثيلي المتكرر والتفريق (clustering)، حيث تُستخدم العلامات الوهمية (pseudo labels) لتحديث التمثيلات، ويُستخدم التفريق لتكوين العلامات الوهمية. على عكس الطرق الحالية التي تعتمد على محاذاة التجميع على أساس كل دورة (epoch)، نقترح خوارزمية تجميع تناضري عميق من الطرف إلى الطرف (end-to-end deep contrastive clustering) تقوم بتحديث معاملات النموذج ومركّزات التجميع بشكل مشترك عبر التعلم المُشرف والتعلم الذاتي (self-supervised)، وتحقيق الاستفادة المثلى من البيانات المُعلّمة وغير المُعلّمة معًا. تتفوّق الطرق المقترحة على البدائل التنافسية على خمسة مجموعات بيانات عامة في كلا الحالتين: (أ) عندما تكون عدد النوايا غير المكتشفة معروفة مسبقًا؛ و(ب) عندما يُقدّر عدد النوايا بواسطة خوارزمية. كما نقترح نسخة مُعتمدة على التفاعل البشري (human-in-the-loop) لتطبيقنا العملي، والتي لا تتطلب تقديرًا مسبقًا للنوايا الجديدة، وتفوق الأداء في النموذج من الطرف إلى الطرف.