الميزات الإضافية لـ BiLSTM لتحسين تسمية التسلسل

تتطلب مهام تسمية التسلسل حساب تمثيل الجملة لكل كلمة ضمن جملة معينة. وتعتمد الطريقة السائدة على استخدام طبقة الذاكرة طويلة المدى ثنائية الاتجاه (BiLSTM) لتعزيز معلومات بنية التسلسل. ومع ذلك، تشير الأدلة التجريبية التي قدمها لي (2020) إلى أن قدرة BiLSTM على إنتاج تمثيلات الجمل للمهام المرتبطة بتسمية التسلسل محدودة بطبيعتها. ينجم هذا الحد بشكل أساسي عن دمج شظايا من تمثيلات الجمل السابقة واللاحقة لصياغة تمثيل جملة كامل. في هذه الدراسة، لاحظنا أن تمثيل الجملة الكامل، الموجود في الخلايا الأولى والأخيرة من BiLSTM، يمكن أن يكمل كل تمثيل جملة فردي لكل خلية. وفقًا لذلك، طورنا آلية سياق عالمي لدمج تمثيلات الجمل المستقبلية والماضية الكاملة في تمثيل الجملة لكل خلية ضمن إطار BiLSTM. من خلال دمج نموذج BERT داخل BiLSTM كمثال، وإجراء تجارب شاملة على تسعة مجموعات بيانات لمهمات تسمية التسلسل، بما في ذلك تحديد الكيانات المسماة (NER)، تصنيف الأجزاء النحوية (POS)، وتحليل المشاعر القائم على الجوانب من النهاية إلى النهاية (E2E-ABSA)، لاحظنا تحسينات كبيرة في درجات F1 والدقة عبر جميع المجموعات البيانات التي تم فحصها.