محاذاة الأهداف في المحاكيات المستخدمية المستندة إلى نماذج اللغة الكبيرة للذكاء الاصطناعي التفاعلي
تُعدّ نماذج المستخدمين أداة حيوية في الذكاء الاصطناعي التفاعلي، حيث تُمكّن من تطوير الوكلاء وتقدير أدائهم على نطاق واسع من خلال التفاعلات المُحاكاة. وعلى الرغم من التقدّم الكبير الذي أحرزته النماذج اللغوية الكبيرة (LLMs) في قدرتها على محاكاة المستخدمين، فإننا نُظهر أن هذه النماذج تواجه صعوبات في التعبير باستمرار عن سلوك موجه نحو أهداف خلال المحادثات متعددة الدورات — وهي نقطة ضعف جوهرية تُقلل من موثوقيتها في التطبيقات اللاحقة. نقدّم إطارًا جديدًا يُدعى "تتبع حالة هدف المستخدم" (UGST)، والذي يُراقب تقدّم هدف المستخدم طوال مسار المحادثة. وباستخدام إطار UGST، نُقدّم منهجية ثلاثية المراحل لتطوير نماذج مستخدمين قادرة على تتبع تقدّم الهدف بشكل ذاتي، والتفكير من أجل إنتاج ردود متوافقة مع الأهداف. علاوةً على ذلك، نُحدد معايير تقييم شاملة لقياس التوافق مع الأهداف في نماذج المستخدمين، ونُثبت أن منهجنا يُحقّق تحسينات كبيرة على معياري تقييمين (MultiWOZ 2.4 وτ-Bench). تُغطي مساهماتنا فجوة حاسمة في مجال الذكاء الاصطناعي التفاعلي، وتجعل من UGST إطارًا أساسيًا لتطوير نماذج مستخدمين متوافقة مع الأهداف.