HyperAIHyperAI

Command Palette

Search for a command to run...

SubRegWeigh: تقييم فعال وكفؤ للشواهد باستخدام التسوية الفرعية للكلمات

Kohei Tsuji¹, Tatsuya Hiraoka², Yuchang Cheng¹,³, Tomoya Iwakura¹,³

الملخص

قد تحتوي مجموعات البيانات في معالجة اللغة الطبيعية (NLP) على أخطاء في التسمية حتى عند تسميتها يدويًا. حاول الباحثون تطوير طرق لتخفيض الأثر السلبي لهذه الأخطاء بشكل آلي. ومع ذلك، فإن الطرق الحالية تستغرق وقتًا طويلًا لأنها تتطلب العديد من النماذج المدربة لاكتشاف الأخطاء. تقترح هذه الورقة البحثية طريقة توفير الوقت تستخدم تقنية تجزئة الكلمات تُعرف بـ "التقنين الفرعي للكلمات" (subword regularization) لمحاكاة عدة نماذج لاكتشاف الأخطاء. يمكن لمETHOD المقترحة لدينا، SubRegWeigh، أن تقوم بتوزيع وزن التسميات أربع إلى خمس مرات أسرع من الطرق الحالية. بالإضافة إلى ذلك، ساهمت SubRegWeigh في تحسين الأداء في مهام تصنيف الوثائق وتحديد الكيانات المسماة. وفي التجارب التي أجريت باستخدام التسميات الخاطئة الوهمية، تمكنت SubRegWeigh من تحديد هذه التسميات بوضوح كأخطاء في التسمية. رمز البرمجة الخاص بنا متاح على الرابط: https://github.com/4ldk/SubRegWeigh .


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
SubRegWeigh: تقييم فعال وكفؤ للشواهد باستخدام التسوية الفرعية للكلمات | مستندات | HyperAI