HyperAIHyperAI

Command Palette

Search for a command to run...

إنشاء مجموعات بيانات باستخدام نماذج اللغة المُدرّبة مسبقًا

Timo Schick Hinrich Schütze

الملخص

للحصول على تمثيلات جمل عالية الجودة من نماذج اللغة المُدرّبة مسبقًا (PLMs)، يجب إما تعزيزها بأهداف تدريب إضافية أو تدريبها بدقة على مجموعة كبيرة من أزواج النصوص المُصنّفة. وعلى الرغم من أن النهج الأخير يتفوّق عادةً على الأول، فإنه يتطلب جهدًا بشريًا كبيرًا لإنشاء مجموعات بيانات مناسبة وذات حجم كافٍ. في هذه الورقة، نُظهر كيف يمكن استغلال نماذج اللغة المُدرّبة مسبقًا لاستخلاص تمثيلات جمل عالية الجودة دون الحاجة إلى بيانات مُصنّفة، أو تدريب دقيق (finetuning)، أو تعديلات في هدف التدريب المسبق: نستفيد من القدرات التوليدية للنماذج الكبيرة والفعّالة من نوع PLMs لإنشاء مجموعات بيانات كاملة من أزواج النصوص المُصنّفة من الصفر، ثم نستخدم هذه المجموعات لتدريب نماذج أصغر وأكثر كفاءة. يُظهر نهجنا المُعتمد بالكامل على البيانات غير المُصنّفة أداءً أفضل من القواعد القوية على عدة مجموعات بيانات لتشابه النصوص الدلاليّة.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp