HyperAIHyperAI
منذ 17 أيام

التمييز عن الكيانات المحددة المستند إلى Transformer مع تمثيل بيانات مدمج

Michał Marcińczuk
التمييز عن الكيانات المحددة المستند إلى Transformer مع تمثيل بيانات مدمج
الملخص

تُجري هذه الدراسة تحليلًا للنماذج القائمة على المحولات (Transformer-based models) وفعاليتها في مهام التعرف على الكيانات الاسمية (Named Entity Recognition). وتستكشف الدراسة استراتيجيات تمثيل البيانات، بما في ذلك الاستراتيجيات الواحدة، والموحدة، والسياقية، التي تستخدم على التوالي جملة واحدة، وعددًا من الجمل، وجمل مُرتبطة بوساطة الانتباه إلى السياق لكل متجه. تُظهر التحليلات أن تدريب النماذج باستخدام استراتيجية واحدة قد يؤدي إلى أداء ضعيف على تمثيلات بيانات مختلفة. وللتغلب على هذا التقييد، تقترح الدراسة إجراء تدريب مدمج يستخدم جميع الاستراتيجيات الثلاث لتحسين استقرار النموذج وقابليته للتكيف. وتُقدَّم النتائج الناتجة عن هذا النهج وتناقش بالنسبة لأربع لغات (الإنجليزية، البولندية، التشيكية، والألمانية) عبر مجموعات بيانات مختلفة، مما يُظهر فعالية الاستراتيجية المدمجة.

التمييز عن الكيانات المحددة المستند إلى Transformer مع تمثيل بيانات مدمج | أحدث الأوراق البحثية | HyperAI