HyperAIHyperAI

Command Palette

Search for a command to run...

مؤشرات واسطة لجودة المحادثات في المجال المفتوح

Ricardo Usbeck Jens Lehmann Rostislav Nedelchev

الملخص

يظل تقييم المحادثات في المجال المفتوح تحدٍّ كبيرًا لا يزال غير محلول بالكامل. وعلى الرغم من الكم الهائل من الأبحاث التي تم إنجازها في هذا المجال، لا يزال يتطلب تقييم جودة المحادثات من قبل مُقيّمين بشريين. وبسبب ذلك، يصبح إجراء مثل هذه التقييمات على نطاق واسع غالبًا أمرًا مكلفًا. تبحث هذه الدراسة في استخدام نموذج تعليم عميق تم تدريبه على معيار تقييم الفهم العام للغة (GLUE) كمؤشر على جودة المحادثات في المجال المفتوح. والهدف هو استخدام مختلف مهام GLUE كزوايا مختلفة لتقييم جودة الحوار، مما يقلل الحاجة إلى بيانات تدريب إضافية أو استجابات مرجعية تُستخدم كمقياس للجودة. وبسبب هذه الطبيعة، يمكن للطريقة استنتاج مجموعة متنوعة من مقاييس الجودة واستخلاص درجة إجمالية قائمة على المكونات. وقد تم تحقيق معاملات ارتباط ذات دلالة إحصائية تصل إلى 0.7.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
مؤشرات واسطة لجودة المحادثات في المجال المفتوح | مستندات | HyperAI