HyperAIHyperAI

Command Palette

Search for a command to run...

منذ 4 أشهر

التحليل الحرفية للكلمات التايلاندية باستخدام انتباه متعدد

{Manabu Okumura Hidetaka Kamigaito Thodsaporn Chay-intr}

الملخص

تم استخدام نماذج فصل الكلمات القائمة على الأحرف بشكل واسع في اللغات المُتَعَقِّدة، بما في ذلك اللغة التايلاندية، نظرًا لأدائها العالي. تقوم هذه النماذج بتقدير حدود الكلمات من خلال تسلسل من الأحرف. ومع ذلك، فإن وحدة الحرف في التسلسلات لا تمتلك معنى جوهريًا مقارنة بوحدات الكلمة، والجزء الفرعي للكلمة، ووحدات تجميع الأحرف. نقترح نموذجًا لفصل الكلمات التايلاندية يستخدم أنواعًا مختلفة من المعلومات، بما في ذلك الكلمات، والأجزاء الفرعية للكلمات، ووحدات تجميع الأحرف، المستمدة من تسلسل الحروف. ويُطبّق نموذجنا انتباهًا متعددًا لتحسين استنتاجات الفصل من خلال تقدير العلاقات المهمة بين الأحرف وأنواع الوحدات المختلفة. وتُظهر النتائج التجريبية أن نموذجنا يمكنه التفوق على النماذج الأخرى الرائدة في فصل الكلمات التايلاندية.

المعايير القياسية

معيار قياسيالمنهجيةالمقاييس
thai-word-tokenization-on-best-2010Multiple Attentions (char-word-cc)
F1-Score: 0.9899

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة المشتركة بالذكاء الاصطناعي
وحدات معالجة رسومات جاهزة
أفضل الأسعار
ابدأ الآن

Hyper Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
التحليل الحرفية للكلمات التايلاندية باستخدام انتباه متعدد | الأوراق البحثية | HyperAI