HyperAIHyperAI
منذ 11 أيام

التحليل الحرفية للكلمات التايلاندية باستخدام انتباه متعدد

{Manabu Okumura, Hidetaka Kamigaito, Thodsaporn Chay-intr}
الملخص

تم استخدام نماذج فصل الكلمات القائمة على الأحرف بشكل واسع في اللغات المُتَعَقِّدة، بما في ذلك اللغة التايلاندية، نظرًا لأدائها العالي. تقوم هذه النماذج بتقدير حدود الكلمات من خلال تسلسل من الأحرف. ومع ذلك، فإن وحدة الحرف في التسلسلات لا تمتلك معنى جوهريًا مقارنة بوحدات الكلمة، والجزء الفرعي للكلمة، ووحدات تجميع الأحرف. نقترح نموذجًا لفصل الكلمات التايلاندية يستخدم أنواعًا مختلفة من المعلومات، بما في ذلك الكلمات، والأجزاء الفرعية للكلمات، ووحدات تجميع الأحرف، المستمدة من تسلسل الحروف. ويُطبّق نموذجنا انتباهًا متعددًا لتحسين استنتاجات الفصل من خلال تقدير العلاقات المهمة بين الأحرف وأنواع الوحدات المختلفة. وتُظهر النتائج التجريبية أن نموذجنا يمكنه التفوق على النماذج الأخرى الرائدة في فصل الكلمات التايلاندية.

التحليل الحرفية للكلمات التايلاندية باستخدام انتباه متعدد | أحدث الأوراق البحثية | HyperAI