تصنيف أفعال المحادثة باستخدام CRF واعية بتغير المتكلم

تعتبر الدراسات الحديثة في تصنيف أفعال المحادثة (DA) هذه المهمة كمشكلة تسمية تسلسلية، باستخدام نماذج الشبكات العصبية المرتبطة بطبقة حقل التوافقي الشرطي (CRF) كطبقة نهائية. حيث يُستخدم نموذج CRF لتمثيل الاحتمال الشرطي للتسلسل الخاص بعلامات DA المستهدفة بالاعتماد على تسلسل الجمل المدخلة. ومع ذلك، فإن المهمة تتضمن أيضًا تسلسلاً مدخلًا مهمًا آخر، وهو تسلسل المشاركين في المحادثة، والذي تم تجاهله في الدراسات السابقة. ولحل هذه القيود، تُقترح في هذه الورقة تعديلًا بسيطًا لطبقة CRF يأخذ في الاعتبار تغير المشاركين. وقد أظهرت التجارب على مجموعة بيانات SwDA أن طبقة CRF المعدلة تتفوق على النسخة الأصلية، بفارق كبير جدًا بالنسبة لبعض علامات DA. علاوةً على ذلك، تُظهر التصورات أن طبقة CRF لدينا قادرة على تعلّم أنماط انتقال معقّدة وذات معنى بين أزواج علامات DA، مع الاعتماد على تغير المشاركين، وبطريقة تتماشى مع التعلم المتكامل (end-to-end). وتم إتاحة الكود المصدر بشكل علني.