منذ 11 أيام
فريق Inception في مهمة NSURL-2019 المهمة 8: التشابه الدلالي في الأسئلة بالعربية
Hana Al-Theiabat, Aisha Al-Sadi

الملخص
يُقدّم هذا البحث منهجيّنا لمهام تشابه الأسئلة الدلالية باللغة العربية ضمن ورشة العمل المخصصة لحلول معالجة اللغة الطبيعية للغات غير الممولة بشكل كافٍ (NSURL). ويهدف البحث إلى بناء نموذج قادر على اكتشاف الأسئلة ذات التشابه الدلالي في اللغة العربية على أساس مجموعة البيانات المقدمة. وتمّ استكشاف طرق مختلفة لتحديد تشابه الأسئلة في هذا العمل. وقد حقق النماذج المقترحة معدلات عالية من دقة القياس F1، تتراوح بين 88% و96%. وتمّ إنتاج أفضل نتيجة رسمية من خلال نموذج تجميع (Ensemble) يعتمد على نموذج BERT متعدد اللغات المُدرّب مسبقًا مع بذور عشوائية مختلفة، حيث بلغت دقة القياس F1 95.924%، مُسجّلة بذلك المركز الأول بين فرق التسعة المُشاركة.