HyperAIHyperAI

Command Palette

Search for a command to run...

UniversalNER: تَنْقِيَةٌ مُوجَّهةٌ من نماذج اللغة الكبيرة للتمييز المفتوح للكيانات المُسَمَّاة

Wenxuan Zhou Sheng Zhang Yu Gu Muhao Chen Hoifung Poon

الملخص

أظهرت النماذج اللغوية الكبيرة (LLMs) قدرة استيعابية ملحوظة، مثل فهم الكيانات والعلاقات المختلفة بشكل عشوائي. وقد أثبتت عملية التكييف بالتعليم فعاليتها في تحويل النماذج اللغوية الكبيرة إلى نماذج أكثر كفاءة من حيث التكلفة، مثل نموذج Alpaca وVicuna. ومع ذلك، تظل هذه النماذج الدراسية تتباعد بشكل كبير عن النماذج الأصلية من حيث الأداء في التطبيقات اللاحقة. في هذه الورقة، نستكشف عملية التكييف المُوجَّهَة باستخدام تكييف تعليمي مُركّز على المهمة، بهدف تدريب نماذج دراسية قادرة على التفوق في فئة واسعة من التطبيقات، مثل استخراج المعلومات المفتوحة. وباستخدام التعرف على الكيانات الاسمية (NER) كدراسة حالة، نوضح كيف يمكن تقليل نموذج ChatGPT إلى نماذج أصغر تُسمى UniversalNER، لتنفيذ استخراج الكيانات المفتوح. ولغرض التقييم، جمعنا أكبر معيار تقييم لـ NER حتى الآن، يشمل 43 مجموعة بيانات موزعة على 9 مجالات متنوعة، مثل الطب الحيوي، البرمجة، وسائل التواصل الاجتماعي، القانون، والمالية. وبلا استخدام أي تدريب مباشر، تحقق UniversalNER دقة ممتازة في التعرف على الكيانات، عبر عشرات الآلاف من أنواع الكيانات، وتفوق النماذج التعليمية العامة مثل Alpaca وVicuna بمتوسط أكثر من 30 نقطة مطلقة في مؤشر F1. وباستخدام جزء ضئيل من عدد المعاملات، لا تكتسب UniversalNER فقط القدرة التي يتمتع بها ChatGPT في التعرف على أنواع كيانات عشوائية، بل تتفوق على دقة NER الخاصة به بمتوسط 7 إلى 9 نقاط مطلقة في مؤشر F1. ومن الملاحظ بشكل استثنائي أن UniversalNER تتفوق بشكل كبير على أنظمة التكييف متعددة المهام المتطورة مثل InstructUIE، التي تعتمد على أمثلة مُعلَّمة لـ NER. كما أجرينا دراسات تحليلية شاملة لتقييم تأثير المكونات المختلفة في منهجيتنا للتكييف. ونُطلق وصفة التكييف، والبيانات، ونماذج UniversalNER، لتمكين الأبحاث المستقبلية في مجال التكييف المُوجَّه.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
UniversalNER: تَنْقِيَةٌ مُوجَّهةٌ من نماذج اللغة الكبيرة للتمييز المفتوح للكيانات المُسَمَّاة | مستندات | HyperAI