HyperAIHyperAI
منذ 2 أشهر

NuNER: تدريب مُشفر التعرف على الكيانات من خلال البيانات المُشَرَّحة بواسطة نماذج اللغة الكبيرة (LLM)

Sergei Bogdanov; Alexandre Constantin; Timothée Bernard; Benoit Crabbé; Etienne Bernard
NuNER: تدريب مُشفر التعرف على الكيانات من خلال البيانات المُشَرَّحة بواسطة نماذج اللغة الكبيرة (LLM)
الملخص

أظهرت نماذج اللغات الكبيرة (LLMs) قدرات مثيرة للإعجاب في تسمية البيانات، مما فتح الباب لطرق جديدة لحل المشكلات التقليدية في معالجة اللغة الطبيعية (NLP). في هذا البحث، نوضح كيفية استخدام نماذج اللغات الكبيرة لإنشاء NuNER، وهو نموذج تمثيل لغوي مدمج متخصص في مهمة التعرف على الكيانات المسماة (NER). يمكن تعديل NuNER بفعالية لحل مشكلات NER التالية باستخدام كميات قليلة من البيانات، حيث يتفوق على النماذج الأساسية المماثلة الحجم في نظام القليل من الطلقات ويتنافس مع نماذج اللغات الكبيرة الأكثر حجماً. وجدنا أن حجم مجموعة البيانات المستخدمة في التدريب الأولي ومتنوعة أنواع الكيانات فيها هما عاملان أساسيان لتحقيق أداء جيد. نعتبر NuNER جزءًا من العائلة الأوسع للنماذج الأساسية الخاصة بالمهام، والتي تم إلغاء قفلها مؤخرًا بواسطة نماذج اللغات الكبيرة.

NuNER: تدريب مُشفر التعرف على الكيانات من خلال البيانات المُشَرَّحة بواسطة نماذج اللغة الكبيرة (LLM) | أحدث الأوراق البحثية | HyperAI