استكشاف التعلم من التسلسل إلى التسلسل في استخلاص مصطلحات الجوانب

استخراج مصطلحات الجوانب (ATE) يهدف إلى تحديد جميع مصطلحات الجوانب في جملة واحدة، وغالبًا ما يُعدّ كمشكلة تصنيف تسلسلي. ومع ذلك، فإن الطرق القائمة على التصنيف التسلسلي لا تُستغل بالكامل المعنى العام للجملة الكاملة، كما أنها تواجه قيودًا في معالجة الاعتماديات بين التصنيفات. ولحل هذه المشكلات، نقوم أولًا بدراسة تشكيل ATE كمهمة تعلم تسلسلي إلى تسلسلي (Seq2Seq)، حيث تتكوّن التسلسل المدخل (المصدر) من الكلمات، والتسلسل المخرج (الهدف) من التصنيفات. وفي الوقت نفسه، لجعل تعلم Seq2Seq مناسبًا لـ ATE، حيث تكون التصنيفات مُرتبطة بكلمات واحدة تلو الأخرى، نصمم وحدات وحدات مُحكمة (gated unit networks) لدمج تمثيل الكلمة المقابلة في المُفكّك (decoder)، ونُطبّق انتباهًا واعيًا للموقع لتركيز الانتباه أكثر على الكلمات المجاورة لكلمة الهدف. أظهرت نتائج التجارب على مجموعتي بيانات أن تعلم Seq2Seq فعّال في ATE، مع استخدام الشبكات المُقترحة من وحدات مُحكمة وآلية انتباه واعية للموقع.