Command Palette
Search for a command to run...
مجموعة كبيرة لتفكيك المحادثات
مجموعة كبيرة لتفكيك المحادثات
Jonathan K. Kummerfeld Sai R. Gouravajhala Joseph J. Peper Vignesh Athreya Chulaka Gunasekara Jatin Gahotra Siva Sankalp Patel Lazaros Polymenakos Walter S. Lasecki
الملخص
تفكيك المحادثات التي تم دمجها في تيار واحد من الرسائل هو مهمة صعبة، وتزداد صعوبة بسبب نقص مجموعات البيانات اليدوية الكبيرة والمصححة يدويًا. قمنا بإنشاء مجموعة بيانات جديدة تتضمن 77,563 رسالة تم تصحيحها يدويًا باستخدام رسوم بيانية لهيكل الردود التي تفكك المحادثات وتحدد بنية المحادثة الداخلية. تعد مجموعتنا من البيانات أكبر بـ16 مرة من جميع مجموعات البيانات السابقة مجتمعة، وهي الأولى التي تشمل حل النزاعات حول التصحيح اليدوي، والأولى التي تشمل السياق. نستخدم بياناتنا لإعادة فحص الأعمال السابقة، خاصةً العثور على أن 80٪ من المحادثات في سجل حواري شائع الاستخدام إما أنها تحتوي على رسائل مفقودة أو رسائل إضافية. توفر بياناتنا المصححة يدويًا فرصة لتطوير طرق قوية تعتمد على البيانات لتفكيك المحادثات، مما سيساعد في تقدم أبحاث الحوار.