الملخص

نُحسِّن النماذج اللغوية التوليدية التلقائية من خلال تكييفها على قطع مستندات تم استردادها من مجموعة بيانات ضخمة، بناءً على التشابه المحلي مع الرموز السابقة. وباستخدام قاعدة بيانات تضم 2 تريليون رمز، يحقق نموذج RETRO (المحول المُعزَّز بالاسترجاع) أداءً مماثلاً لنموذج GPT-3 وJurassic-1 على مجموعة Pile، رغم استخدامه لعدد من المعاملات أقل بـ 25 مرة. وبعد التدريب الدقيق، يُترجم أداء RETRO إلى مهام متعددة تعتمد على المعرفة في المهام التطبيقية، مثل الإجابة على الأسئلة. يدمج RETRO مسترجِع Bert ثابت، ومشفر قابل للتمييز، وآلية انتباه متقاطع مُقسَّمة إلى قطع، لتمكين توقع الرموز بناءً على بيانات تفوق بكثير كمية البيانات التي تُستهلك عادةً أثناء التدريب. ورغم أننا نُدرّب RETRO عادةً من الصفر، إلا أنه يمكننا أيضًا تكييف نماذج محولات مُدرَّبة مسبقًا بسرعة باستخدام الاسترجاع، مع الحفاظ على أداء جيد. تفتح أبحاثنا آفاقًا جديدة لتحسين النماذج اللغوية من خلال الذاكرة الصريحة على نطاق غير مسبوق.

ملف PDF المصدر

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا

سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين

مدعوم بواسطة MailChimp

الملخص

HyperAI

منذ 6 أشهر

توليد مدعوم بالاسترجاع

Transformer

توليد النص

النهج/المعمارية

معالجة اللغة الطبيعية

مهمة

Sebastian Borgeaud Arthur Mensch Jordan Hoffmann Trevor Cai Eliza Rutherford Katie Millican George van den Driessche Jean-Baptiste Lespiau Bogdan Damoc Aidan Clark

الملخص

ملف PDF المصدر

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا

سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين

مدعوم بواسطة MailChimp

Command Palette

تحسين النماذج اللغوية من خلال استرجاع تريليونات التوكنات

Sebastian Borgeaud Arthur Mensch Jordan Hoffmann Trevor Cai Eliza Rutherford Katie Millican George van den Driessche Jean-Baptiste Lespiau Bogdan Damoc Aidan Clark18 more

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

تحسين النماذج اللغوية من خلال استرجاع تريليونات التوكنات

Sebastian Borgeaud Arthur Mensch Jordan Hoffmann Trevor Cai Eliza Rutherford Katie Millican George van den Driessche Jean-Baptiste Lespiau Bogdan Damoc Aidan Clark18 more

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

تحسين النماذج اللغوية من خلال استرجاع تريليونات التوكنات

Sebastian Borgeaud Arthur Mensch Jordan Hoffmann Trevor Cai Eliza Rutherford Katie Millican George van den Driessche Jean-Baptiste Lespiau Bogdan Damoc Aidan Clark18 more

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Sebastian Borgeaud Arthur Mensch Jordan Hoffmann Trevor Cai Eliza Rutherford Katie Millican George van den Driessche Jean-Baptiste Lespiau Bogdan Damoc Aidan Clark

Sebastian Borgeaud Arthur Mensch Jordan Hoffmann Trevor Cai Eliza Rutherford Katie Millican George van den Driessche Jean-Baptiste Lespiau Bogdan Damoc Aidan Clark

Sebastian Borgeaud Arthur Mensch Jordan Hoffmann Trevor Cai Eliza Rutherford Katie Millican George van den Driessche Jean-Baptiste Lespiau Bogdan Damoc Aidan Clark