HyperAIHyperAI

Command Palette

Search for a command to run...

Prompt2Model: إنشاء نماذج قابلة للنشر من تعليمات بلغة طبيعية

Vijay Viswanathan Chenyang Zhao Amanda Bertsch Tongshuang Wu Graham Neubig

الملخص

تمكن نماذج اللغة الكبيرة (LLMs) مُنشئي الأنظمة اليوم من إنشاء أنظمة معالجة اللغة الطبيعية (NLP) قادرة على الأداء من خلال التحفيز (prompting)، حيث يكفي لهم وصف المهمة بلغة طبيعية وتقديم عدد قليل من الأمثلة. ومع ذلك، من جوانب أخرى، تمثل نماذج اللغة الكبيرة خطوة للوراء مقارنة بالنماذج التقليدية المخصصة لمعالجة اللغة الطبيعية؛ فهي تتطلب موارد حاسوبية واسعة النطاق لتنفيذها، ويمكن أن تكون مقيّدة خلف واجهات برمجة التطبيقات (APIs). في هذا البحث، نقترح طريقة عامة تُسمى Prompt2Model، تأخذ وصفًا لمهمة بلغة طبيعية مشابهًا للتحفيزات المقدمة إلى نماذج اللغة الكبيرة، وتستخدم هذا الوصف لتدريب نموذج مخصص يسهل تطبيقه. يتم ذلك من خلال عملية متعددة المراحل تشمل استرجاع مجموعات بيانات ونماذج مُدرّبة مسبقًا، وإنشاء بيانات باستخدام نماذج اللغة الكبيرة، ثم التدريب المُراقب الدقيق على هذه المجموعات المسترجعة والمحسوبة. على مدى ثلاث مهام، نُظهر أنه بالاعتماد على نفس التحفيز القليل (few-shot prompt)، يتمكن Prompt2Model من تدريب نماذج تتفوق على نتائج نموذج لغة قوي مثل gpt-3.5-turbo بمتوسط 20٪، مع أن حجمها قد يكون أصغر بنسبة تصل إلى 700 مرة. كما نُظهر أن هذه البيانات يمكن استخدامها لتقديم تقديرات موثوقة لأداء النماذج، ما يمكّن مطوري النماذج من تقييم موثوقية النموذج قبل التنفيذ. يُتاح Prompt2Model مفتوح المصدر عبر الرابط التالي: https://github.com/neulab/prompt2model.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp