HyperAIHyperAI

Command Palette

Search for a command to run...

التركيز على الكيانات المحددة المحتملة أثناء اكتساب التسميات النشطة

Ali Osman Berk Sapci Oznur Tastan Reyyan Yeniterzi

الملخص

تمامًا كما هو مذكور في النص، يهدف التعرف على الكيانات المعرفة (NER) إلى تحديد الإشارات إلى الكيانات المعرفة في النص غير المنظم وتصنيفها ضمن فئات كيانات معرفة محددة مسبقًا. وعلى الرغم من أن النماذج اللغوية المُدرّبة مسبقًا القائمة على التعلم العميق تساعد في تحقيق أداء تنبؤي جيد في مهام NER، إلا أن العديد من التطبيقات الخاصة بالقطاعات (domain-specific) تتطلب ما يكفي من البيانات المُعلّمة. وقد استُخدمت تقنية التعلم النشط (AL)، وهي إطار عام لمشكلة اكتساب التسميات، في مهام NER لتقليل تكلفة التسمية دون التضحية بأداء النموذج. ومع ذلك، فإن التوزيع المُتَحَيِّز بشدة بين الفئات في التوكنات (tokens) يُشكّل تحديًا في تصميم أساليب استعلام فعّالة لـ AL في NER. ونُقدِّم في هذا العمل عدة دوال لتقييم استعلامات الجمل التي تُركّز أكثر على التوكنات المحتملة ذات القيمة الموجبة، ونُقيّم هذه الدوال باستخدام استراتيجيات تقييم تكلفة مبنية على الجملة وعلى التوكن. كما نقترح أيضًا منهجية تطبيع أفضل تعتمد على البيانات لمعاقبة الجمل الطويلة جدًا أو القصيرة جدًا. وتكشف التجارب التي أجريناها على ثلاث مجموعات بيانات من مجالات مختلفة أن النهج المقترح يقلل من عدد التوكنات المُعلَّمة المطلوبة، مع تحقيق أداء تنبؤي أفضل أو مُقارِب لأداء الطرق التقليدية.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp