HyperAIHyperAI
منذ شهر واحد

نماذج LSTM-CRF ثنائية الاتجاه لتصنيف التسلسلات

Zhiheng Huang; Wei Xu; Kai Yu
نماذج LSTM-CRF ثنائية الاتجاه لتصنيف التسلسلات
الملخص

في هذا البحث، نقترح مجموعة من النماذج المستندة إلى شبكات الذاكرة القصيرة والطويلة الأجل (LSTM) لتصنيف التسلسلات. تشمل هذه النماذج شبكات LSTM، وشبكات LSTM ثنائية الاتجاه (BI-LSTM)، وشبكات LSTM مع طبقة حقل عشوائي مشروط (CRF) (LSTM-CRF)، وشبكات LSTM ثنائية الاتجاه مع طبقة CRF (BI-LSTM-CRF). يعتبر عملنا هو الأول الذي يطبق نموذج LSTM ثنائية الاتجاه مع طبقة CRF (يُشار إليه بـ BI-LSTM-CRF) على مجموعات بيانات المعايير في معالجة اللغة الطبيعية (NLP). نوضح أن نموذج BI-LSTM-CRF يمكنه استخدام الخصائص الدخيلة من الماضي والمستقبل بكفاءة بفضل مكون LSTM ثنائي الاتجاه. كما يمكنه استخدام معلومات العلامات على مستوى الجملة بفضل طبقة CRF. يمكن لنموذج BI-LSTM-CRF إنتاج دقة تصل إلى الحالة المتقدمة أو قريبة منها في مجموعات بيانات POS وchunking وNER. بالإضافة إلى ذلك، فهو قوي وي依赖较少于词嵌入,与之前的观察相比。注:最后一句中的“依赖较少于词嵌入,与之前的观察相比”在阿拉伯语中可以更自然地表达为:بالإضافة إلى ذلك، فهو قوي ويعتمد بشكل أقل على تمثيل الكلمات المدمجة مقارنة بالمشاهدات السابقة.最终翻译如下:في هذا البحث، نقترح مجموعة من النماذج المستندة إلى شبكات الذاكرة القصيرة والطويلة الأجل (LSTM) لتصنيف التسلسلات. تشمل هذه النماذج شبكات LSTM، وشبكات LSTM ثنائية الاتجاه (BI-LSTM)، وشبكات LSTM مع طبقة حقل عشوائي مشروط (CRF) (LSTM-CRF)، وشبكات LSTM ثنائية الاتجاه مع طبقة CRF (BI-LSTM-CRF). يعتبر عملنا هو الأول الذي يطبق نموذج LSTM ثنائية الاتجاه مع طبقة CRF (يُشار إليه بـ BI-LSTM-CRF) على مجموعات بيانات المعايير في معالجة اللغة الطبيعية (NLP). نوضح أن نموذج BI-LSTM-CRF يمكنه استخدام الخصائص الدخيلة من الماضي والمستقبل بكفاءة بفضل مكون LSTM ثنائي الاتجاه. كما يمكنه استخدام معلومات العلامات على مستوى الجملة بفضل طبقة CRF. يمكن لنموذج BI-LSTM-CRF إنتاج دقة تصل إلى الحالة المتقدمة أو قريبة منها في مجموعات بيانات POS وتشكيل الجمل وتحديد الكيانات المسماة (NER). بالإضافة إلى ذلك، فهو قوي ويعتمد بشكل أقل على تمثيل الكلمات المدمجة مقارنة بالمشاهدات السابقة.

نماذج LSTM-CRF ثنائية الاتجاه لتصنيف التسلسلات | أحدث الأوراق البحثية | HyperAI