HyperAIHyperAI

Command Palette

Search for a command to run...

تعلم عامل تمييز الكيانات الاسمية الموحّدة من مجموعات نصية متعددة مُعلّمة جزئيًا لتمكين التكيّف الفعّال

Xiao Huang Li Dong Elizabeth Boschee Nanyun Peng

الملخص

تمييز الكيانات المعرفة (NER) يُحدد الإشارات إلى الكيانات ذات الأنواع في النص الخام. وعلى الرغم من أن المهمة مُستقرة جيدًا، إلا أنه لا يوجد مجموعة علامات (tagset) موحدة تُستخدم على نطاق واسع: غالبًا ما تُعلّم البيانات لاستخدامها في تطبيقات لاحقة، وبالتالي تغطي فقط مجموعة صغيرة من أنواع الكيانات ذات الصلة بمهام محددة. على سبيل المثال، في المجال الطبي الحيوي، قد تُعلّم مجموعة نصية واحدة الكيانات المرتبطة بالجينات، بينما تُعلّم أخرى الكيانات المرتبطة بالمواد الكيميائية، وثالثة تُعلّم الكيانات المرتبطة بالأمراض—رغم أن النصوص في كل مجموعة تحتوي على إشارات إلى جميع أنواع الكيانات الثلاثة. في هذا البحث، نقترح نموذجًا عميقًا منظمًا لدمج هذه "المجموعات المُعلّمة جزئيًا" بهدف تحديد جميع أنواع الكيانات التي تظهر في مجموعات التدريب بشكل مشترك. وباستغلال عدة مجموعات بيانات، يمكن للنموذج تعلُّم تمثيلات دخول قوية؛ وبفضل بناء نموذج منظم مشترك، يتجنب التعارضات المحتملة الناتجة عن دمج تنبؤات عدة نماذج في وقت الاختبار. تُظهر التجارب أن النموذج المقترح يتفوّق بشكل ملحوظ على نماذج التعلم متعدد المهام القوية عند التدريب على عدة مجموعات بيانات جزئيًا مُعلّمة، واختبارها على مجموعات بيانات تحتوي على علامات من أكثر من واحدة من مجموعات التدريب.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp