الذاكرة طويلة المدى قصيرة الأجل لتقسيم الكلمات اليابانية

تقدم هذه الدراسة نهجًا يستخدم شبكة عصبية ذات ذاكرة طويلة قصيرة المدى (LSTM) لتقسيم الكلمات في اللغة اليابانية (JWS). وقد حققت الدراسات السابقة في تقسيم الكلمات باللغة الصينية (CWS) نجاحًا باستخدام الشبكات العصبية المتكررة مثل LSTM ووحدات التكرار المشروطة (GRU). ومع ذلك، على عكس اللغة الصينية، تشمل اللغة اليابانية عدة أنواع من الحروف، مثل الهيراغانا والكاتاكانا والكانجي، مما ينتج عنه تباينات أرثوغرافية ويزيد من صعوبة تقسيم الكلمات. بالإضافة إلى ذلك، من المهم في مهام تقسيم الكلمات اليابانية مراعاة السياق العالمي، بينما تعتمد النماذج التقليدية لـ JWS على الخصائص المحلية. لحل هذه المشكلة، تقترح هذه الدراسة استخدام نهج مستند إلى LSTM لـ JWS. تشير النتائج التجريبية إلى أن النموذج المقترح يحقق دقة رائدة على مستوى التقنيات الحديثة بالنسبة لمختلف المجموعات اليابانية للكلمات.