الملخص

تفكيك المحادثات التي تم دمجها في تيار واحد من الرسائل هو مهمة صعبة، وتزداد صعوبة بسبب نقص مجموعات البيانات اليدوية الكبيرة والمصححة يدويًا. قمنا بإنشاء مجموعة بيانات جديدة تتضمن 77,563 رسالة تم تصحيحها يدويًا باستخدام رسوم بيانية لهيكل الردود التي تفكك المحادثات وتحدد بنية المحادثة الداخلية. تعد مجموعتنا من البيانات أكبر بـ16 مرة من جميع مجموعات البيانات السابقة مجتمعة، وهي الأولى التي تشمل حل النزاعات حول التصحيح اليدوي، والأولى التي تشمل السياق. نستخدم بياناتنا لإعادة فحص الأعمال السابقة، خاصةً العثور على أن 80٪ من المحادثات في سجل حواري شائع الاستخدام إما أنها تحتوي على رسائل مفقودة أو رسائل إضافية. توفر بياناتنا المصححة يدويًا فرصة لتطوير طرق قوية تعتمد على البيانات لتفكيك المحادثات، مما سيساعد في تقدم أبحاث الحوار.

ملف PDF المصدر

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار