HyperAIHyperAI
منذ 2 أشهر

مجموعة كبيرة لتفكيك المحادثات

Jonathan K. Kummerfeld; Sai R. Gouravajhala; Joseph Peper; Vignesh Athreya; Chulaka Gunasekara; Jatin Ganhotra; Siva Sankalp Patel; Lazaros Polymenakos; Walter S. Lasecki
مجموعة كبيرة لتفكيك المحادثات
الملخص

تفكيك المحادثات التي تم دمجها في تيار واحد من الرسائل هو مهمة صعبة، وتزداد صعوبة بسبب نقص مجموعات البيانات اليدوية الكبيرة والمصححة يدويًا. قمنا بإنشاء مجموعة بيانات جديدة تتضمن 77,563 رسالة تم تصحيحها يدويًا باستخدام رسوم بيانية لهيكل الردود التي تفكك المحادثات وتحدد بنية المحادثة الداخلية. تعد مجموعتنا من البيانات أكبر بـ16 مرة من جميع مجموعات البيانات السابقة مجتمعة، وهي الأولى التي تشمل حل النزاعات حول التصحيح اليدوي، والأولى التي تشمل السياق. نستخدم بياناتنا لإعادة فحص الأعمال السابقة، خاصةً العثور على أن 80٪ من المحادثات في سجل حواري شائع الاستخدام إما أنها تحتوي على رسائل مفقودة أو رسائل إضافية. توفر بياناتنا المصححة يدويًا فرصة لتطوير طرق قوية تعتمد على البيانات لتفكيك المحادثات، مما سيساعد في تقدم أبحاث الحوار.

مجموعة كبيرة لتفكيك المحادثات | أحدث الأوراق البحثية | HyperAI