HyperAIHyperAI
منذ 17 أيام

تحسين فصل الكلمات الصينية باستخدام شبكات الذاكرة الكلمية

{Yan Song, Yuanhe Tian, Yonggang Wang, Fei Xia, Tong Zhang}
تحسين فصل الكلمات الصينية باستخدام شبكات الذاكرة الكلمية
الملخص

تُعد السمات السياقية دائمًا ذات دور مهم في تقسيم الكلمات الصينية (CWS). وتشير معلومة "الصفة الكلمية" (Wordhood information)، التي تعد واحدة من السمات السياقية، إلى فعاليتها في العديد من نماذج التقسيم التقليدية القائمة على الأحرف. ومع ذلك، لم تحظَ هذه المعلومة باهتمام كافٍ في النماذج العصبية الحديثة، كما يُعد تصميم إطار عمل قادر على دمج معلومات الصفة الكلمية المستمدة من مقاييس مختلفة للصفة الكلمية بشكل مناسب داخل الإطارات العصبية الحالية تحديًا كبيرًا. ولذلك، نقترح في هذه الورقة إطارًا عصبيًا يُسمى WMSeg، يستخدم شبكات الذاكرة (Memory Networks) لدمج معلومات الصفة الكلمية مع عدة تركيبات شائعة من المُشفّر-المُفكّك (Encoder-Decoder) في مهام CWS. تُظهر النتائج التجريبية على خمسة مجموعات بيانات معيارية أن آلية الذاكرة نجحت في نمذجة معلومات الصفة الكلمية بشكل فعّال بالنسبة للنماذج العصبية، وساعدت WMSeg على تحقيق أداءً من الدرجة الأولى (state-of-the-art) على جميع هذه المجموعات. كما تُظهر التجارب والتحليلات الإضافية قوة الإطار المقترح من حيث المرونة تجاه مقاييس مختلفة للصفة الكلمية، بالإضافة إلى الكفاءة العالية لمعلومات الصفة الكلمية في التجارب عبر المجالات المختلفة.