منذ 6 أشهر

الملخص

تم استخدام نماذج فصل الكلمات القائمة على الأحرف بشكل واسع في اللغات المُتَعَقِّدة، بما في ذلك اللغة التايلاندية، نظرًا لأدائها العالي. تقوم هذه النماذج بتقدير حدود الكلمات من خلال تسلسل من الأحرف. ومع ذلك، فإن وحدة الحرف في التسلسلات لا تمتلك معنى جوهريًا مقارنة بوحدات الكلمة، والجزء الفرعي للكلمة، ووحدات تجميع الأحرف. نقترح نموذجًا لفصل الكلمات التايلاندية يستخدم أنواعًا مختلفة من المعلومات، بما في ذلك الكلمات، والأجزاء الفرعية للكلمات، ووحدات تجميع الأحرف، المستمدة من تسلسل الحروف. ويُطبّق نموذجنا انتباهًا متعددًا لتحسين استنتاجات الفصل من خلال تقدير العلاقات المهمة بين الأحرف وأنواع الوحدات المختلفة. وتُظهر النتائج التجريبية أن نموذجنا يمكنه التفوق على النماذج الأخرى الرائدة في فصل الكلمات التايلاندية.

ملف PDF المصدر عرض الكود

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار